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Python 一 直 是 开发 自动 化 程序 的 首选 编程 语言 ， 随 着 大 数据 和 人 工 智 能 的 兴起 ， 很 多 
企业 投身 于 智能 化 和 自动 化 开发 。Python 开发 自动 化 程序 不 再 仅 限 于 自动 化 测试 ， 它 已 应 
于 网 络 爬 虫 和 业务 流程 自动 化 等 方面 ， 将 重复 性 的 业务 交 由 程序 处 理 ， 从 而 释放 劳动 力 ， 
正 因 如 此 ， 自 动 化 开发 成 为 当下 最 为 追捧 的 技术 之 一 。 

本 书 站 在 初学 者 的 角度 ， 从 原理 到 实践 ， 循 序 渐进 地 讲述 了 使 用 Python 进行 自动 化 开 
发 的 核心 技术 。 全 书 从 逻辑 上 可 分 为 Python 基础 知识 、Python 自动 化 技术 和 开发 自动 化 系 
统 三 部 分 。Python 基础 知识 主要 介绍 Python 的 变量 、 数 据 类 型 、 流 程控 制 语 句 、 函 数 与 类 
等 基础 语法 ， 帮 助 不 熟悉 编程 的 读者 快速 掌握 Python 编程 技巧 。Python 自动 化 技术 分 别 介 
如 网 页 、 计 算 机 系统 、 软 件 和 手机 的 自动 化 开发 技术 ， 并 将 自动 化 开发 与 人 工 智 能 的 计算 
机 视觉 结合 使 用 ， 使 自动 化 程序 更 为 稳定 和 智能 。 自 动 化 系统 是 将 所 有 自动 化 程序 统一 调 
度 和 管理 的 Web 系统 ， 本 部 分 通过 开发 一 个 自动 化 系统 来 实现 分 布 式 管理 自动 化 程序 的 运 
行情 况 。 

本 书 是 笔者 使 用 Python 编写 自动 化 程序 和 开发 自动 化 系统 的 经 验 总 结 , 全 书 循 序 渐进 ， 
浅 入 深 ， 结 合 当前 各 种 热点 新 技术 ， 从 事 软件 自动 化 开发 和 编写 自动 化 程序 及 进行 软件 
自动 化 测试 的 读者 能 够 从 本 书 中 获得 收益 。 


本 书 结构 
本 书 共 分 15 章 ， 从 逻辑 上 可 分 为 三 部 分 : 


第 1 部 分 ， 第 1~7 章 讲述 Python 的 基础 知识 ， 主 要 内 容 包括 : 搭建 开发 环境 、 变 量 与 
运算 符 、 数 据 类 型 与 控制 语句 、 函 数 与 类 以 及 异常 机 制 。 

第 2 部 分 , 第 8~13 章 讲述 Python 的 自动 化 技术 ， 主 要 内 容 包 括 : 网 页 自动 化 、 接 口 自 
动 化 、 系 统 自动 化 、 软 件 自动 化 、 利 用 计算 机 视觉 实现 自动 化 以 及 手机 App 自动 化 。 

第 3 部 分 ， 第 14~15 章 讲述 自动 化 系统 的 开发 ， 由 Python 的 Flask 框架 实现 ， 首 先 介 
绍 Flask 的 基础 知识 ， 然 后 讲述 自动 化 系统 的 开发 过 程 。 


本 书 特色 


循序 渐进 ， 知 识 全 面 : 本 书 站 在 初学 者 的 角度 ， 围 绕 Python 的 自动 化 技术 展开 讲解 ， 
从 初学 者 必 备 基础 知识 着 手 ， 循 序 渐进 地 介绍 了 自动 化 程序 开发 和 实现 的 各 种 知识 ， 内 容 


AS 
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难度 适中 ， 由 浅 入 深 ， 实 用 性 强 ， 履 盖 面 广 ， 条 理 清 晰 ， 且 具有 较 强 的 逻辑 性 和 系统 性 。 
实例 丰富 ， 扩 展 性 强 : 本 书 每 个 知识 点 都 单独 以 一 个 项 目 为 例 进行 讲解 ， 力 求 让 读者 


更 容易 地 掌握 知识 要 点 。 本 书 实例 经 过 作者 的 精心 设计 和 挑选 ， 根 据 编者 
总 结 而 来 ， 涵 盖 在 实际 开发 中 遇 到 的 各 种 问题 。 


基于 理论 ， 注 重 实践 : 在 讲解 的 过 程 中 ， 不 仅 介绍 理论 知识 ， 而 且 安排 了 综合 应 


例 或 小 型 应 用 程序 ， 将 理论 应 用 到 实践 中 ， 加 强 读者 的 实际 开发 能 力 ， 巩 
关 知 识 。 


源 代码 下 载 
本 书 源 代码 的 github 下 载 地址 : 


https://github.com/xyjw/python-Automation 


也 可 以 扫描 右 侧 二 维 码 下 载 。 
如 果 你 在 下 载 过 程 中 遇 到 问题 ,可 发 送 邮 件 至 554301449@qq.com 
获得 帮助 ， 邮 件 标 题 为 “Python 自动 化 开发 实战 下 载 资源 ”。 


技术 服务 


EI 


的 实际 开发 经 验 


将 


开发 技能 和 相 


读者 在 学 习 或 者 工作 的 过 程 中 ， 如 果 遇 到 实际 问题 ， 可 以 加 入 QQ 群 93314951 与 笔者 


联系 ， 笔 者 会 在 第 一 时 间 给 予 回复 。 
读者 对 象 


本 书 主要 适合 以 下 读者 阅读 : 

* 从 零 开始 学 习 编 写 自 动 化 程序 的 初学 者 和 大 学 生 
* Python 自动 化 开发 工程 师 。 

* 从 事 自动 化 测试 和 运 维 的 技术 人 员 。 

* 培训 机 构 及 网 课 教 学 用 书 。 


虽然 笔者 力求 本 书 更 至 完美 ， 但 由 于 水 平 所 限 ， 难 免 会 出 现 错误 ， 欢 迎 广 大 读者 和 高 


手 专家 给 予 指正 ， 笔 者 将 十 分 感谢 。 


编者 
2019 年 3 月 
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认识 Python 


本 章 主要 介绍 Python 的 概念 、 搭 建 Python 的 开发 环境 及 实现 简单 的 功能 输出 ， 通 过 本 
章 的 学 习 ， 使 读者 对 Python 有 一 定 的 了 解 和 认 知 ， 并 做 好 开发 Python 程序 的 准备 。 


1.1 了 解 Python 


Python 是 一 种 面向 对 象 的 解释 型 计算 机 程序 设计 语言 ， 由 荷兰 人 Guido van Rossum 于 
1989 年 发 明 ， 第 一 个 公开 发 行 版 发 行 于 1991 年 。 它 是 纯粹 的 自由 软件 ， 源 代 码 和 解释 器 
CPython 遵循 GPL (General Public License) 协议 ， 同 时 被 称 为 胶水 语言 ， 能 够 把 其 他 开发 
语言 制作 的 各 种 模块 (尤其 是 C/C++) 很 轻松 地 联结 在 一 起 使 用 。 

Python 为 我 们 提供 了 非常 完善 的 标准 模块 ， 履 盖 了 网 络 、 文 件 、GUI、 数 据 库 和 文本 
等 大 量 功能 模块 ， 形 象 地 称 作 “ 内 置 电池 (batteries included) ”。 使 用 Python 开发 程序 ， 
许多 功能 不 必 从 零 编 写 ， 直 接 调 用 现成 的 即 可 。 除 了 内 置 的 模块 外 ，Python 还 有 大 量 的 第 
三 方 模块 ， 这 是 别人 开发 的 ， 并 且 免 费 供 我 们 直接 使 用 。 如 果 我 们 开发 的 代码 通过 封装 处 
理 ， 也 可 以 作为 第 三 方 模块 给 别人 使 用 。 

发 明 者 Guido van Rossum 给 Python 的 定位 是 “优雅 ”、“ 明 确 ”、 “简单 ”， 所 以 Python 
开发 的 程序 看 上 去 总 是 简单 易 懂 ， 同 一 个 功能 ，Python 的 代码 量 比 其 他 开发 语言 更 为 简洁 。 
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初学 者 学 习 Python， 不 但 入 门 容易 ， 而 且 将 来 深入 下 去 ， 也 可 以 编写 非常 复杂 的 程序 。 


任何 编程 


语言 都 有 缺点 ，Python 也 不 例外 。Python 的 主要 缺点 是 运行 速度 慢 ， 与 C 程 


序 相 比 会 显得 非常 慢 ， 因 为 Python 是 解释 型 语言 ， 代 码 在 执行 时 会 一 行 一 行 地 翻译 成 CPU 
能 理解 的 机 器 码 ， 这 个 翻译 过 程 非常 耗 时 ， 而 C 程序 是 运行 前 直接 编译 成 CPU 能 执行 的 机 


器 码 。 


但 是 现在 大 量 的 应 用 程序 不 需要 这 么 快 的 运行 速度 ， 因 为 用 户 根本 感觉 不 出 来 。 例 如 
一 个 下 载 MP3 的 网 络 应 用 程序 ，C 程序 的 运行 时 间 需 要 0.001 秒 ， 而 Python 程序 的 运行 时 


间 需 要 0.1 秒 ， 慢 了 100 倍 ， 但 由 于 网 络 数据 传输 更 慢 ， 需 要 等 待 1 秒 ， 因 此 用 户 是 无 法 感 
受到 程序 运行 的 速度 。 
因为 Python 是 解释 型 语言 ， 其 代码 是 由 Python 解释 器 执行 。 整 个 Python 语言 从 规范 
到 解释 器 都 是 开源 的 ， 在 理论 上 ， 只 要 水 平 够 高 ， 任 何人 都 可 以 编写 Python 解释 器 来 执行 
Python 代码 。 目 前 ，Python 的 解释 器 主要 有 以 下 几 种 ， 如 表 1-1 所 示 。 
表 1-1 Pyton 主要 的 解释 器 
解释 器 说 明 
CPython Python 官方 使 用 的 解释 器 ， 由 C 语言 开发 ， 也 是 目前 使 用 最 广 的 Python 解释 器 
i IPython 是 基于 CPython 之 上 的 一 个 交互 式 解释 器 ， 在 交互 方式 上 有 所 增强 ， 但 是 执行 
代码 的 功能 和 CPython 是 完全 一 样 的 
pypy PyPy 是 另 一 个 Python 解释 器 ， 它 的 目标 是 执行 速度 。 PyPy 采用 JIT 技术 ， 对 Python 
代码 进行 动态 编译 ， 因 此 提高 了 Python 代码 的 执行 速度 
Jython 是 运行 在 Java 平台 上 的 Python 解释 器 ， 可 以 直接 把 Python 代码 编译 成 Java 字 
Jython Md 
节 码 执行 
IronPython 和 Jython 类 似 ， 只 不 过 IronPython 是 运行 在 微软 .Net 平台 上 的 Python 解释 
IronPython 


器 ， 可 以 直接 把 Python 代码 编译 成 .Net 的 字 节 码 


1.2 安装 Python 3 


目前 ，Python 主要 分 为 两 大 版 本 : Python 2.X 和 Python 3.X。Python 核心 团队 计划 在 
2020 年 停止 支持 Python 2.X， 现 在 很 多 第 三 方 模块 已 开始 不 再 支持 Python 2.X 的 使 用 。 因 
此 本 书 以 最 新 版 本 Python 3.7 为 例 ， 讲 述 如 何在 Windows 下 安装 Python。 

首先 在 浏览 器 上 输入 https://www.python.org/downloads/release/python-370/， 这 是 
Python 安装 包 的 下 载 界面 。 在 下 载 界面 上 找到 exe 安装 包 的 下 载 地 址 并 单 击 下 载 ， 安 装 包 


的 下 载 地 址 如 


图 1-1 所 示 。 
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Files 


Version 
Gaipped source tarball 

#2 compressed souree tarball 
macos 6+ bv32 bitinstatler 
macos +-bitinstaller 
Wndows help fie 


Windows ns6-64 embeddable zlp fle 


Wndows 86-64 web-based Instaler 
Windows xa6 embeddable ip he 
Windows x86 executable installer 


Windows x85 web-based instalier 


‘Operating System Description 


Source release 
Source elease 
MacosX 
Macosx 
Windows 
Windows 
Windows 
wndows 
Wndows 
Windows 


Wndows 


图 1-1 


forMac Osx 106 and ater 


forOsxX109and later 


[or AMDEA/EMST/AS4 
for AMDEA/EMSsT/s4 


fOrAMDSWEMGT/ N54 


ossum 
lbesssdebalsTaled517a7d9a580271 
baaa6hla1dc081aco7714aH6B10 
aaebs032do1fedozet2163a734335e 
717a02efea3b0eb3aaadc6a0dcd98 
addoccT680348180dca 
258173ed541defl0a5 
Salcafctatce0adl07b5d2c6al29bese 
T5aaeclZba40zd04d2 
5323bec2072301d6f 
bbEdt4casdcleaTes028T7381afefto 


Tscs085464eb3ee5bla4idoeabca4 


Python 下 载 地 址 


Flesim 
2745726 
16922100 
39274481 
27551275 
547589 
aa6062 
25262280 
132n60 
6395982 
25506832 


1298260 


安装 包 下 载 完 成 后 ， 在 安装 包 所 在 路 径 打 开 exe 安装 包 ， 然 后 勾 选 “Add Python 3.7 to 
Path” 并 单 击 “Customize installation”， 如 图 1-2 所 示 。 


单 击 “Customize installation” 将 会 进入 “Optional Features” 界 面 ， 在 该 界 


选项 勾 选 并 单 击 “Next” 按 钮 ， 如 图 1-3 所 示 。 


Install Python 3.7.0 (64-bit) 


Select instal Now to Install Python with cefoult settngz or aoose 
Customize to enable or disable features, 


» Install Now 


CNucereieacerozWAppDataMecanprogramepythorhpyrhon37 


Tncludes IDLE, pip and documentstion 
Creates shoricuts nd fle associations 


» Customize installation 
Chocee location and features Stop 2 


nstal auncher for sl users (recommended) 


python 
1 
windows 


图 1-2 ”Python 安装 界面 


Step 1 


上 把 全 部 


Optional Features 


A Dormentation 


Inesal me Python documentation fie. 


Bpp 


Instals PP which aan cownload and install other Python packages. 


回 tdnk and IDLE 


nstals Whinter and the IDLE development envin 


Python test suite 


Installs the standl 


py laurcher Ftoral 


lbrary est sufte 


rs reaures elevation] 


Installs the globsl py auncher to make ht easier to start Python 


| ane 


图 1-3 ”Optional Features 界面 


从 “Optional Features” 界 面 进入 到 “Advanced Options” 界 面 ， 将 界面 上 的 全 部 选项 
勾 选 后 并 设置 Python 的 安装 路 径 ， 本 书 将 Python 安装 在 E:\Python， 如 图 1-4 所 示 。 

最 后 单 击 Install 按钮 ， 等 待 程序 完成 安装 即 可 。 安 装 时 间 由 于 各 个 电脑 与 网 络 的 差异 
会 造成 不 同 ， 只 需 耐 心 等 候 即 可 。 安 装 完成 后 ， 打 开 Windows 的 命令 符 窗口 ， 输 入 


“python” 并 按 回 车 键 即 可 


入 Python 的 交互 模式 ， 如 图 1-5 所 示 。 
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Advanced Options 
回 Installfor all users 


回 AssoGate files with Python (requires the py launchen 


回 Create shortauts for installed applications 


回 Add Python to environment variables 
回 Precompile standard brary 
回 Download debugging symbols 


回 Download debug binaries (requires VS 2015 or laten 


Customize install location 
ENPython 


puthon 
ft 
windows Install 


图 1-4 Advanced Options 界面 


图 1-5 Python 的 交互 模式 


至 此 ， 在 Windows 下 已 完成 Python 的 安装 。 由 于 本 书后 面 章节 的 实例 主要 在 Windows 
下 实现 ， 所 以 本 书 不 再 讲述 Linux 和 MacOS 下 安装 Python 的 过 程 ， 有 需要 的 读者 可 以 自行 
网 上 搜索 相关 资料 。 


1.3 ”安装 PyCharm 


PyCharm 是 一 种 Python IDE， 它 带 有 一 整套 可 以 帮助 用 户 在 使 用 Python 语言 开发 时 提 
高 其 效率 的 工具 ， 比 如 调试 、 语 法 高 亮 、Project 管理 、 代 码 跳 转 、 智 能 提示 、 自 动 完成 、 单 
元 测试 、 版 本 控制 等 。 此 外 ， 该 IDE 提供 了 一 些 高 级 功能 ， 例 如 支持 Django 框架 下 的 专 \ 
Web 开发 。 

在 浏览 器 输入 下 载 地 址 http://wwwjetbrains.com/pycharm/download， 可 以 看 到 PyCharm 
分 别 支 持 Windows、Linux 和 MacOS 三 大 系统 的 使 用 ， 版 本 分 为 专业 版 和 社区 版 。 专 业 版 
提供 了 完整 的 功能 ， 如 专业 的 Web 开发 ， 但 需要 支付 相应 的 费用 ; 社区 版 完全 免费 使 用 ， 
但 只 提供 一 些 基 础 的 开发 功能 
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本 章 以 在 Windows 下 安装 PyCharm 专业 版 为 例 ， 在 官网 上 下 载 Windows 的 PyCharm 
专业 版 安装 包 ， 双 击 打开 安装 包 ， 并 根据 安装 提示 完成 安装 过 程 即 可 。 安 装 过 程 相 对 较为 
简单 ， 本 书 就 不 做 详细 的 介绍 。 

完成 PyCharm 安装 后 ， 在 桌面 上 双击 PyCharm 的 图 标 ， 将 其 运行 启动 。 初 次 运行 
PyCharm， 用 户 进行 简单 的 设置 后 会 进入 软件 激活 界面 ， 激 活 方式 有 三 种 ，Jetbrains 用 户 
激活 、 激 活 码 和 许可 服务 器 。 如 图 1-6 所 示 。 


图 1-6 ”PyCharm 激活 界面 
在 网 络 上 可 以 通过 搜索 “PyCharm 破解 ”分 别 获取 激活 码 和 许可 服务 器 来 激活 PyCharm 


的 使 用 权限 ， 但 这 种 方式 有 一 个 时 效 性 ， 时 间 一 到 又 要 重新 激活 。 也 可 以 通过 安装 补丁 的 方 
式 实现 永久 使 用 此 处 仅 作 教学 使 用 ， 建 议 使 用 正式 版 )， 具 体操 作 步 又 如 下 。 

在 本 章 的 源码 中 找到 JetbrainsCrack-2.8-release-enc.jar 文件 ， 并 存放 在 本 地 系统 某 个 文 
件 夹 ， 本 章 将 文件 存放 在 PyCharm 的 安装 目录 bin 文件 夹 ， 如 图 1-7 所 示 。 


np 
人 


~ + Fi C9 » Program Fe » jerlraine » Pycharm 2018.14 + bi 


图 1-7 bin 文件 夹 信息 
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将 两 个 


在 bin 文件 夹 下 找到 pycharm.exe.vmoptions 和 pycharm64.exe.vmoptions 文件 ， 并 
文件 以 记事 本 的 方式 打开 ， 分 别 在 最 下 方 添加 相应 代码 并 保存 文件 ， 添 加 代码 如 下 : 


-javaagent:C:/Program Files/JetBrains/PyCharm 2018.1.4/bin/ 


JetbrainsCrack-2.8-release-enc.jar 


mm 
nn 
T 


最 后 运行 PyCharm， 在 激活 界面 选择 Activation code 并 输入 以 下 激活 码 激活 ， 
licenseeName、assigneeName 和 assigneeEmail 是 可 以 自行 命名 的 。 激 活 码 如 下 所 示 : 


ThisCrackLicenseId-{ 

Lconsord™ mlOLL™ 
"licenseeName":"aa", 
"assigneeName":"aa", 
"assigneeEmail":"554301449@qq.com", 
"licenseRestriction™:"", 
"checkConcurrentUse":false, 
sproducts®:l 
{"code":"II","paidUpTo":"2099-12-31"}), 
{"code":"DM", "paidUpTo":"2099-12-31"}, 
{"code":"AC", "paidUpTo":"2099-12-31"}, 
{"code":"RS0","paidUpTo":"2099-12-31"}, 
{"code":"WS", "paidUpTo":"2099-12-31"}), 
{"code DPN", "paidUpTo":"2099-12-31"}, 
{"code":"RC", "paidUpTo":"2099-12-31"}, 
{"code":"PS", "paidUpTo":"2099-12-31"}, 
{"code DC", "paidUpTo":"2099-12-31"}, 
{"code":"RM", "paidUpTo":"2099-12-31"}, 
{"code":"CcL", "paidUpTo":"2099-12-31"}, 
"PC" "paidUpro" "2099=12=3L™} 


{coder 
局 
"hashu "2ol12 T7670 
"gracePeriodDays":7, 
"autoProlongated":false} 


PyCharm 成 功 激活 后 ， 将 会 进入 PyCharm 的 使 用 界面 ， 如 图 1-8 所 示 。 

至 此 ，PyCharm 的 安装 和 激活 过 程 已 讲述 完成 ， 上 述 的 教程 可 能 会 随 着 PyCharm 版 本 
的 更 新 而 发 生 细 微 的 差异 。 这 里 通过 讲述 PyCharm 的 安装 和 激活 ， 让 初学 者 对 PyCharm 有 
初步 的 认识 。 
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PyCharm 


Croate New Project 


图 1-8 PyCharm 的 使 用 界面 


1.4 安装 第 三 方 模块 


到 此 Python 的 开发 环境 基本 上 搭建 完成 ， 主 要 是 安装 Python 四 在 开发 过 程 
中 ， 如 果 需 要 使 用 第 三 方 模块 ， 必 须 在 本 地 系统 安装 该 模块 才能 在 代码 中 使 用 ， 否 则 代码 
在 运行 过 程 中 会 提示 错误 信息 。 安 装 第 三 方 模块 可 以 使 用 Pip 执行 安装 ，Pip is 
两 种 : 在 线 安 装 和 本 地 安装 ， 具体 安 和 过 程 说 明 如 下 : 

使 用 Pip 主要 在 Windows 的 命令 提示 符 窗口 输入 安装 指令 即 可 完成 ， 如 果 是 其 他 系统 
可 以 在 系统 的 终端 输入 安装 指令 。 我 们 在 Windows 下 打开 命令 提示 符 窗 口 ， 以 安装 第 三 方 
模块 requests 为 例 ， 在 窗口 中 直接 输入 “pip install requests ”指令 ，pip install 是 固定 的 安装 指 
令 ; requests 是 模块 名 。 我 们 只 需 等 待 指令 执行 完毕 即 可 完成 模块 的 安装 ， 如 图 1-9 所 示 。 


图 1-9 Pip 在 线 安装 
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如 果 以 本 地 安装 的 方式 来 安装 第 三 方 模块 ， 首 先 从 网 络 上 下 载 安 装 包 ， 在 浏览 器 中 输 
入 安装 包 的 下 载 地 址 https://www.lfd.uciedu/~gohlke/pythonlibs/， 找 到 与 系统 相对 应 的 模块 
信息 ， 以 Mysqlclient 为 例 ， 如 图 1-10 所 示 。 


mysqlclient-1.3.13-cp27-cp27m-win32.whl 


mysq 27m-win amd64.whl 
p34-cp34m-win_amd64.whl 
p35-cp35m-win32.whl 
m-win_amd64.whl 
36m-win32whl 
mysqlclient-1.3.13- m-win_amd64 whl 
mysqlclient-13.1 m-win32whl 
mysqlclient-1.3.13-c m-win_ amd64 whl 


图 1-10 模块 信息 


以 图 1-10 的 mysqlclient-1.3.13-cp37-cp37m-win_ amd64(win32).whl 为 例 ， 该 模块 名 包 
含 以 下 信息 : 


(1) mysqlclient: 模块 名 。 

(2) 1.3.13: 模块 的 版 本 型 号 。 

(3) cp37-cp37m: 支持 Python 3.7 版 本 适用 。 
(4) win amd64: 支持 Windows 64 位 系统 使 用 。 
(5) win32: 支持 Windows 32 位 系统 使 用 。 


模块 下 载 后 ， 在 命令 提示 符 使 用 Pip 安装 模块 安装 包 ， 我 们 将 安装 包 放 置 在 本 地 D 盘 
的 根 目 录 ， 然 后 输入 指令 “pip install D:mysqlclient-1.3.13-cp37-cp37m-win amd64.whl” 即 
可 完成 安装 ， 如 图 1-11 所 示 。 


图 1-11 Pip 本 地 安装 
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如 果 在 使 用 Pip 安装 第 三 方 模块 的 过 程 中 ， 系 统 提 示 “'pip' 不 是 内 部 或 外 部 命令 ， 也 
不 是 可 运行 的 程序 或 批 处 理 文件 ”这 一 错误 信息 的 时 候 ， 这 是 由 于 在 安装 Python 的 过 程 中 
没有 勾 选 “Add Python 3.7 to Path” 选 项 。 

解决 这 一 问题 ， 只 需 将 Python 的 装 目录 和 Python 安装 目录 \Scripts， 分 别 添 加 到 环境 变 
量 Path 即 可 。 如 本 书 的 Python 的 安装 目录 为 E:\Python， 环 境 变量 Path 设置 如 图 1-12 所 示 。 


系统 属性 


人 则 ， [Hs | 大 | 本 | 了 | 


控制 面板 主 页 要 进行 ,你 以 机 作为 管理 员 登 录 . 
网 设备 管理 各 
国 远 BiR 重 视 芝 效果 , 处 理 请 寺 划 , 内 究 使 用 ， 以 及 直拨 内 存 
国 天 六 全 护 


国 高 家 系统 设置 


用 户 配置 文件 
与 登录 帐户 相关 的 桌面 设置 


系统 变量 (S) 
过 量 值 
JAVAHOME CAprogram FIevavavdkl8o171 
NUMBER_OF PR... 4 
Windows NT 


图 1-12 设置 环境 变量 Path 


1.5 我 的 “Hello World” 


每 一 门 编程 语言 都 是 从 “Hello World” 开 始 ，“Hello World” 是 由 Brian Kernighan 创 
建 的 ，1978 年 ，Brian Kemighan 写 了 一 本 书 名 为 《C 程序 设计 语言 》 的 编程 书 ， 在 程序 员 
中 广 为 流 传 。 从 此 ，“Hello World” 成 为 每 门 编程 语言 的 入 门 基础 。 

Python 输出 “Hello World” 的 方式 有 两 种 : 交互 模式 和 命令 行 模 式 。 两 者 说 明 如 下 : 
(1) 交互 模式 在 第 1.2 节 中 己 有 提 及 ， 用 户 输入 一 行 代码 并 按 回 车 ，Python 解释 器 就 
会 执行 这 行 代码 。 
(2) 命令 行 模式 是 在 py 文件 里 编写 代码 ， 然 后 执行 整个 py 文件 ，Python 解释 器 会 从 
py 文件 中 读 取代 码 并 逐 行 执行 。 


10 | Python 自动 化 开发 实战 


打开 命令 提示 符 窗口 ， 然 后 输入 “python” 并 按 回 车 键 ， 这 样 就 会 进入 Python 的 交互 
模式 。 在 交互 模式 下 ， 输 入 “print(Hello World)” 并 按 回 车 键 ， 此 时 交互 模式 的 窗口 会 返 
回 “Hello World”， 如 图 1-13 所 示 。 


Cu-1914 64 bit 《RMD6| 


e" for more infozrmation- 


图 1-13 交互 模式 输出 “Hello World” 


如 果 通 过 命令 行 模式 输出 “Hello World”， 首 先 创建 hw.py 文件 ， 然 后 使 用 PyCharm 


打开 文件 并 输入 代码 “print(Hello World)”。 最 后 运行 hw.py 文件 ， 运 行 方式 有 两 种 : 
PyCharm 和 命令 提示 符 。 

在 PyCharm 中 打开 hw.py 文件 ， 输 入 代码 后 ， 然 后 在 代码 编辑 区 域内 单 击 鼠 标 右键 ， 
选择 并 单 击 “Run hw'”， 这 时 PyCharm 会 自动 执行 hw.py 文件 的 代码 ， 并 将 结果 显示 在 正 
下 方 。 如 图 1-14 所 示 。 


Ele Edit View Navigate Code Refactor Run Iools VCS Window Help 
EE) 篇 hwpy 


钨 hwpy 


print 


ce 
WHello World’) 


py Reference 


Pacte 


Paste from History.. 


Paste Simple 


Column Selection Mode 
Find Usages 

Retactor 

Folding 


GoTo 


hw 
E:\Fython\python. exe 
Hello World 


de 0 


2 Profi 
于 Concurrency Diagram for hw 
寺 Save hw 

Show in Explorer 


Process finished with exit co 


Open interminal 
Local History 
Execute Line in Console 
Run Flein Console 

从 compare with ciipboard 


图 1-14 PyCharm 执行 py 文件 
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如 果 想 在 命令 提示 符 窗口 中 执行 py 文件 ， 首 先 启动 命令 提示 符 ， 然 后 将 当前 的 路 径 + 
换 到 hw.py 文件 所 在 的 路 径 ， 最 后 输入 指令 “python hwpy”， 当 前 窗口 会 自动 执行 ee 
文件 的 代码 。 如 图 1-15 所 示 。 


图 1-15 命令 提示 符 执行 py 文件 


:实际 的 开发 过 程 中 ， 我 们 开发 的 功能 主要 以 命令 行 模式 执行 ， 而 交互 模式 多 数 用 于 
功能 的 调试 和 模块 的 安装 验证 等 。 


1.6 本章 小 结 


本 章 介 绍 了 Python 的 起 源 及 其 特点 ， 并 分 别 讲述 Windows 下 如 何 安装 Python、 
PyCharm 以 及 第 三 方 模块 和 “Hello World” 入 门 。 重 点 说 明 如 下 : 


(1) 了 解 Python 的 起 源 及 其 特点 ， 特 别 是 Python 目前 主流 的 解释 器 以 及 其 适用 范围 。 

(2) 掌握 Python 和 PyCharm 的 安装 ， 对 于 PyCharm 的 使 用 ， 本 书 没 有 详细 介绍 ， 这 
也 是 开发 人 员 需 要 掌握 的 ， 读 者 可 以 自行 了 解 。 

(3) 第 三 方 模块 的 安装 主要 分 为 在 线 安 装 和 本 地 安装 ， 但 两 者 都 是 通过 Pip 工具 完 
成 的 。 

(4) “Hello World” 是 Python 的 入 门 基础 ， 从 中 可 了 解 Python 简单 的 入 门 语法 。 


本 章 主要 介绍 Python 的 变量 及 运算 符 的 使 用 ， 读 者 要 重点 掌握 变量 的 概念 、 命 名 规则 
和 规范 、 深 浅 拷 贝 的 区 别 、 运 算 符 的 类 型 以 及 运算 逻辑 等 基础 知识 。 


2.1 变量 的 命名 与 使 用 


变量 来 源 于 数学 ， 在 计算 机 语言 中 能 储存 计算 结果 或 表示 值 的 抽象 概念 。 变 量 可 以 通 
过 变量 名 设 定 ， 大 多 数 情况 下 ， 变 量 是 可 变 的 。 在 计算 机 编程 里 面 ， 变 量 是 非常 有 用 的 
它 对 每 一 段 数据 都 赋 给 一 个 简短 、 易 于 记忆 的 名 字 ， 这 个 数据 可 以 是 用 户 输入 的 数据 、 特 
定 运算 的 结果 以 及 程序 输出 数据 等 。 简 而 言 之 ， 变 量 是 用 于 跟踪 所 有 数据 的 简单 工具 。 

Python 的 变量 与 其 他 编程 有 所 区 别 ， 如 Java 和 C#， 这 类 编程 语言 需要 定义 变量 类 型 才 
能 对 变量 进行 使 用 。 而 Python 的 变量 无 需 定义 变量 类 型 ， 直 接 对 变量 赋值 即 可 ，Python 会 
根据 变量 值 来 自动 识别 变量 类 型 。 

变量 类 型 包含 了 数据 类 型 ， 数 据 类 型 会 在 第 3 章 详细 介绍 ， 常 用 变量 类 型 的 种 类 有 整 
型 、 字 符 串 、 浮 点 型 、 布 尔 型 、 字 典 和 元 组 列表 等 。 简 单 地 理解 ， 变 量 可 以 比 作 为 一 个 
人 ， 而 人 又 分 为 男人 和 女人 ， 这 里 的 男人 和 女人 就 相当 于 变量 类 型 ， 是 根据 性 别 的 不 同 进 
行 分 类 的 ， 而 变量 类 型 则 是 根据 变量 值 的 不 同 进行 分 类 的 。 
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了 解 了 变量 和 变量 类 型 后 ， 接 下 来 学 习 Python 的 变量 如 何 定义 及 使 用 。 我 们 在 


PyCharm 下 输入 以 下 代码 : 


iVariable = 10 


cVariable = "Hello World' 
bVariable = True 
fVariable = 1.12 


print (' 整 型 为 : '，ivVariable) 

print (' 字 符 串 为 : '，cvariable) 
print (' 布 尔 型 为 : '，bvariable) 
print (' 浮 点 型 为 : '， fvVariable) 


在 PyCharm 中 运行 上 述 代 码 ， 查 看 代码 输出 结果 ， 如 图 2-1 所 示 。 


Connected to pydev debugger (build 181.5087.37) 
整 型 为 : 10 

字符 串 为 : Hello World 

布尔 型 为 : True 


浮 点 型 为 : 1.12 


Process finished with exit code 0 


图 2-1 输出 结果 


上 述 代码 中 ， 我 们 分 别 定义 了 4 个 不 同类 型 的 变量 ， 比 如 变量 iVariable， 变 量 首 个 


母 i 代表 变量 类 型 为 整 型 (int) ，Variable 代表 变量 。 变 量 命 名 一 般 遵 从 以 下 规则 : 


(1) 变量 名 只 能 是 字母 (A-Z,a-z) 、 数 字 〈0-9) 或 下 划 线 。 

(2) 第 一 个 字母 不 能 是 数字 ， 例 如 2Variable， 这 不 是 一 个 合法 的 变量 。 
(3) 不 能 是 Python 关键 字 ， 例 如 不 能 用 class 这 个 单词 来 命名 一 个 变量 。 
(4) 区 分 大 小 写 ， 例 如 iA 和 ia 是 两 个 不 同 的 变量 。 


EE 


学 


理论 上 ， 在 遵守 了 上 面 几 条 规则 的 前 提 下 ， 所 命名 的 变量 都 是 合法 的 ， 有 时 变量 命名 


尽管 是 合法 的 ， 但 可 读 性 非常 差 也 不 可 取 ， 所 以 ， 在 实际 编程 中 ， 变 量 命名 往往 都 有 


志 | 


的 一 个 命名 规范 ， 本 书 介绍 一 种 常见 的 命名 规范 : 


(1) 一 个 单词 作为 变量 时 ， 单 词 首 个 字母 建议 大 写 ， 并 在 单词 最 前 方 添加 变量 类 型 ， 


如 上 述 的 iVariable。 


(2) 如 果 变 量 由 多 个 单词 组 成 ， 每 个 单词 首 个 字母 大 写 ， 单 词 直接 拼接 并 在 单词 最 前 


方 添加 变量 类 型 ， 如 ijMyVariable。 


14 | Python 自动 化 开发 实战 


(3) 如 果 不 想 在 变量 前 添加 变量 类 型 ， 变 量 首 个 字母 为 小 写 ， 若 有 多 个 单词 拼接 ， 则 
拼接 的 单词 首 个 字母 为 大 写 ， 如 variable 或 myVariable。 


了 解 了 变量 的 命名 后 ， 下 一 步 我 们 来 介绍 变量 的 使 用 。 从 上 述 代码 中 ， 我 们 将 变量 值 

进行 输出 ， 这 个 输 intro 每 个 变量 在 使 用 前 都 必须 赋值 ， 变 量 赋值 以 后 

该 变量 才 会 被 创建 。 比 如 执行 “print(' 变 量 为 : '，variable)” 这 一 行 代码 ， 程 序 执行 时 会 提 

示 错 误 信息 “NameError: name "variable' is not defined”， 这 是 由 于 变量 variable 没有 赋值 ， 

所 以 程序 执行 过 程 中 并 没有 创建 变量 variable 而 提示 variable 没有 被 定义 的 错误 信息 。 
Python 还 支持 多 个 变量 同时 赋值 ， 多 变量 赋值 主要 有 两 种 方式 ， 第 一 种 赋值 方式 是 首 

先 创建 一 个 整 型 对 象 ， 其 值 为 1， 然 后 对 变量 a、b、c 进行 赋值 ， 第 二 种 赋值 方式 是 分 别 创 

建 三 个 不 同类 型 的 对 象 ， 然 后 分 别 赋值 给 变量 d4、e、f。 代 码 如 下 : 

和 方式 一 

a=b=c=1 

print ta Ler, a} 


print('b is', b) 

printt ue su ey 

# 方式 三 

d, e, f = 10, 'hello', True 
printd ds dl 

print('e is', e) 

print( "ft Tsu £} 


变量 的 命名 与 使 用 相对 较为 简单 ， 读 者 只 需 掌握 变量 的 命名 规则 以 及 使 用 方式 即 可 。 
最 后 上 述 提 及 到 不 能 使 用 Python 关键 字 作为 变量 名 ，Python 中 共有 33 个 关键 字 ， 这 些 关键 
字 都 不 可 当 作 变量 名 来 使 用 ， 如 表 2-1 所 示 。 
表 2-1 Python 关键 字 


False True None class ype and 
elif Else as 


break Continue Import 1 
pass Retum 


except While assert finally Nonlocal 
Talse With yield 
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2.2 ”变量 的 深浅 拷贝 


变量 的 拷贝 是 对 变量 进行 数据 处 理 的 时 候 ， 为 了 保留 数据 处 理 前 的 变量 而 重新 定义 新 
的 变量 ， 简 单 来 说 ， 就 是 将 一 个 变量 的 数据 复制 到 另外 一 个 变量 里 。 我 们 可 以 通过 代码 的 
形式 加 以 说 明 : 

二 三 "hello World" 

= 

print (b) 

# 程序 输出 hello World 


通过 b=a 这 种 方式 将 字符 串 “hello World” 分别 赋值 给 变量 a 和 变量 b。 变 量 的 拷贝 主 
要 分 为 浅 拷贝 和 深 拷贝 ， 这 两 种 拷贝 方式 主要 用 于 数据 类 型 为 列表 和 字典 的 变量 。 

在 第 2.1 节 中 ， 我 们 提 到 数据 类 型 主要 有 整 型 、 字 符 串 、 浮 点 型 、 布 尔 型 、 字 典 和 元 
组 列表 等 。 本 节 以 列表 为 例 ， 列 表 可 以 理解 为 队列 ， 如 现实 生活 中 的 排队 购 票 ， 这 个 队伍 
可 理解 为 Python 的 列表 ， 而 队伍 中 每 一 个 人 可 理解 为 列表 的 元 素 。 

现在 将 列表 以 代码 的 形式 表示 ， 并 由 变量 list_1 表示 ， 然 后 通过 浅 拷贝 的 方式 赋值 给 
list_ 2， 最 后 修改 list_2 的 某 个 元 素 ， 观 察 变量 list_1 和 list_2 的 具体 变化 。 代 码 如 下 : 


# import 是 Python 里 面 导 入 功能 模块 ， 此 处 会 在 后 续 章节 讲述 
import copy 

# 生成 1ist_1 列表 ， 列 表 有 4 个 元 素 

i ER 0 

# 通过 浅 拷贝 的 方式 赋值 给 变量 1ist_2 

list 2 = list 1 

# copy.copy 是 函数 方法 ， 该 函数 来 自 import copy 的 导入 
# list 2 = copy.copy (list 1) 

# 修改 变量 1ist_2 某 个 元 素 的 值 

ligE 212 = Vs 

# 分 别 输出 1ist_1 和 1ist_ 2， 观察 变化 

print (list 1) 

print (list 2) 


上 述 代 码 涉及 到 列表 的 使 用 、 功 能 模块 的 导入 和 函数 的 调用 ， 这 些 都 是 Python 的 基础 
语法 之 一 ， ae 节 中 详细 讲述 。 本 节 主 要 讲述 变量 list_ 1 的 值 为 
列表 或 字典 的 时 候 ， 通 过 list_ 2=list 1 的 浅 拷贝 ， 当 某 个 变量 的 列表 元 素 发 生变 化 时 ， 观 察 
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另外 一 个 变量 的 变化 情况 。 上 述 代码 的 输出 结 


四 


果 如 图 2-2 所 示 。 


图 2-2 变量 浅 拷贝 的 输出 结果 


从 图 中 可 以 看 到 ， 如 果 变 量 a 是 一 个 列表 或 字典 ， 并 且 通 过 浅 拷贝 的 方式 生成 变量 b， 
其 中 一 个 变量 发 生 改 变 时 ， 另 外 一 个 变量 也 会 随 之 变化 。 
在 上 述 条 件 下 ， 如 果 其 中 一 个 变量 发 生 改变 ， 另 外 一 个 变量 不 会 随 之 变化 ， 这 样 可 以 
使 用 深 拷贝 的 方式 实现 。 根 据 上 述 代码 进行 简单 的 修改 即 可 实现 ， 代 码 如 下 : 
import copy 
is ET 3 
# 变量 1ist 1 深 拷 贝 到 变量 1ist 2 
list 2 = copy.deepcopy (list 1) 
# 修改 变量 1ist_2 某 个 值 
E22 
# 分 别 输出 1ist_1 和 1ist_2， 观 察 变化 
print (list 1) 
print (list 2) 


将 上 述 代 码 运 行 输出 ， 查 看 变量 list_ 1 和 变量 list_ 2 的 变化 情况 ， 从 输出 结果 可 以 看 
到 ， 当 修改 变量 list_2 某 个 元 素 的 时 候 ， 变 量 list_1 不 会 发 生 任何 变化 。 输 出 结果 如 图 2-3 
所 示 。 


让 


图 2-3 ”变量 深 拷贝 的 输出 结果 

本 节 主 要 讲述 变量 深浅 拷贝 的 使 用 ， 深 浅 拷贝 只 适用 于 变量 值 为 列表 或 字典 的 变量 ， 
在 日 常 开 发 中 ， 开 发 者 常常 会 由 于 一 时 大 意 而 忽略 深浅 拷贝 的 区 别 ， 导 致 程序 出 现 错误 而 
无 法 查 明 原因 ， 因 此 读者 要 明确 区 分 深浅 拷贝 的 差异 。 


2.3 ”运算 符 的 使 用 


编程 里 面 的 运算 符 就 好 比 我 们 数学 里 面 的 加 减 乘除 等 运算 法 则 ， 每 一 种 编程 语言 的 运 
算 符 是 大 同 小 异 的 。Python 支持 以 下 类 型 的 运算 符 。 


2.3.1 
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算术 运算 符 : 计算 两 个 变量 的 加 减 乘 除 等 计算 法 则 。 

比较 (关系 ) 运算 符 : 比较 两 个 变量 的 大 小 情况 

赋值 运算 符 : 先 计算 后 赋值 到 新 的 变量 。 

逻辑 运算 符 : 与 或 非 的 逻辑 判断 。 

位 运算 符 : 把 数值 看 成 二 进 制 来 进行 计算 。 

成 员 运算 符 : 判断 字符 串 、 元 组 、 列 表 或 字典 中 是 否 含有 成 员 。 

身份 运算 符 : 用 于 比较 两 个 对 象 的 存储 单位 ， 比 如 判断 变量 a 和 b 在 计算 机 的 内 存 地址 
是 否 一 致 。 


算术 运算 符 


算术 运算 符 也 就 是 我 们 常 说 的 加 减 乘除 法 则 ， 主 要 在 程序 里 实现 简单 的 运算 。Python 
的 算术 运算 符 如 表 2-2 所 示 。 


表 2-2 ”Python 的 算术 运算 符 


运算 符 描 述 实 例 

和 加 法 ， 两 个 对 象 相 加 x=2+3，x 的 值 为 5 
- 减法 ， 两 个 对 象 相 减 或 者 用 于 负数 的 表示 x=2 -3，x 的 值 为 -1 
局 乘法 ， 两 个 数 相 乘 x=2*3，x 的 值 为 6 
/ 除法 x=9/2，x 的 值 为 4.5 


x=9%2，x 的 值 为 1 
x=2**3，x 的 值 为 8 


取 模 ， 获 取 除法 中 的 余数 
军 ， 求 出 几 个 相同 因数 的 积 


取 整 ， 获 取 除法 中 的 整数 x=9//2，x 的 值 为 4 


Ve = 3 


Print (' 加 法 运算 符 : '， 
print (' 减 法 运算 符 :'， 
print (' 乘 法 运算 符 : '，x*y) 
print (' 除 法 运算 符 : '， 
print (' 取 模 运算 符 :，' 


X+Y) 
X-Y) 


X/Y) 
x%y) 


print (' 宕 运算 符 : '，x**y) 
print (' 取 整 运算 符 : '，x//y) 


在 PyCharm 上 运行 上 述 代 码 ， 运 行 结果 如 图 2-4 所 示 。 
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加 法 运算 符 : 13 
减法 运算 符 : 3 
乘法 运算 符 : 40 
除法 运算 符 : 1.6 


取 模 运算 符 : 3 
窜 运 算 符 : 32768 
取 整 运算 符 : 1 


图 2-4 算术 运算 符 的 输出 结果 


2.3.2 ”比较 运算 符 


比较 〈 关 系 ) 运算 符 是 比较 两 个 变量 之 间 的 大 小 关系 ， 而 且 两 个 变量 的 数据 类 型 必须 
相同 ， 比 较 结果 以 True 或 者 False 返回 。Python 的 比较 (关系 运算 符 如 表 2-2 所 示 。 
表 2-3 Python 的 比较 关系) 运算 符 
实 例 
2 二 3， 比 较 结果 为 False 
2 !=3， 比 较 结果 为 True 


运 算 符 描 述 
所 等 于 ， 比 较 两 个 对 象 是 否 相等 
上 = 不 等 于 ， 比 较 两 个 对 象 是 否 不 相等 


> 类 于 2>3， 比 较 结果 为 False 
< 小 于 2<3， 比 较 结果 为 True 
>= 大 于 等 于 2 >= 3， 比 较 结果 为 False 
<= 小 于 等 于 2 <= 3， 比 较 结果 为 True 


我 们 将 通过 代码 来 进一步 讲述 比较 (关系 运算 符 的 具体 操作 ， 代 码 如 下 : 


4 

Y=3 

print (' 等 于 运算 符 : '，x==y) 
print (' 不 等 于 运算 符 : '，x!=y) 
print (' 大 于 运算 符 : '，x>y) 
print (' 小 于 运算 符 : '，x<y) 
print (' 大 于 等 于 运算 符 : '，x>=y) 
Print (' 小 于 等 于 运算 符 : '，x<=y) 


上 述 代码 设置 变量 x 和 y， 然 后 通过 比较 (关系) 运算 符 将 两 变量 进行 对 比 并 将 对 比 结 
果 输 出 。 在 PyCharm 中 运行 代码 ， 运 行 结果 如 图 2-5 所 示 。 
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等 于 运算 符 : False 
不 等 于 运算 符 : True 
大 于 运算 符 : False 


小 于 运算 符 : True 


大 于 等 于 运算 符 : False 
小 于 等 于 运算 符 : True 


图 2-5 ”比较 运算 符 的 输出 结果 


2.3.3 ”赋值 运算 符 


赋值 运算 符 是 算术 运算 符 的 一 个 特殊 使 用 ， 其 实质 是 两 个 变量 进行 算术 运算 并 将 运算 
结果 重新 赋值 到 其 中 一 个 变量 里 。Python 的 赋值 运算 符 如 表 2-3 所 示 。 


表 2-4 Python 的 赋值 运算 符 


运算 符 描 述 实 例 

全 简单 的 赋值 运算 符 c=a+b 将 a+b 的 运算 结果 赋值 为 c 
二 加 法 赋值 运算 符 c+=a 等 效 于 c=c+a 

es 减法 赋值 运算 符 c 一 a 等 效 于 c=c-a 

Lin 乘法 赋值 运算 符 c*=a 等 效 于 c=c*a 

A 除法 赋值 运算 符 c/=a 等 效 于 c=c/a 

%= 取 模 赋值 运算 符 c%=a 等 效 于 c=c%a 

bi 徊 赋值 运算 符 c**=a 等 效 于 c=c**a 

/三 取 整 赋值 运算 符 c/ 厂 a 等 效 于 c=c//a 


根据 上 述 的 赋值 运算 符 ， 我 们 通过 代码 的 形式 加 以 实现 。 由 于 每 次 赋值 运行 后 ， 变 量 x 
的 数值 会 发 生变 化 ， 因 此 执行 下 次 赋值 运算 时 必须 重 设 变量 x 的 数值 。 具 体 代 码 如 下 


汪汪 

全 二 起 

Print (' 简 单 的 赋值 运算 符 : '，x+y) 
xX += Y 

print (' 加 法 赋值 运算 符 : '，x) 

> 

< 

print (' 减 法 赋值 运算 符 : '，x) 
RR 


A 
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print (' 乘 法 赋值 运算 符 : '，x) 
X=5 

a 

print (' 除 法 赋值 运算 符 : '，xz) 
X=5 

站 = 

print (" 取 模 赋值 运算 符 : '，x) 
X=5 

FRV 
print (' 笑 赋值 运算 符 :'，x) 
Es 

0 

print (' 取 整 赋值 运算 符 : '，x) 


每 次 执行 赋值 运算 的 时 候 ， 变 量 x 和 y 的 值 都 是 5 和 2 进行 计算 并 赋值 给 变量 x， 可 以 通 


过 输出 结果 检测 赋值 计算 是 否 正确 。 上 述 代码 在 PyCharm 中 运行 ， 运 行 结果 如 图 2-6 所 示 。 


简单 的 赋值 运算 符 : 
加 法 赋值 运算 符 
减法 赋值 运算 符 : 
乘法 赋值 运算 符 


埋 赋 值 运算 符 : 25 
取 整 赋值 运算 符 : 


图 2-6 赋值 运算 符 的 输出 结果 


2.3.4 ”逻辑 运算 符 


逻辑 运算 符 是 将 多 个 条 件 进行 与 或 非 的 逻辑 判断 ， 这 种 类 型 的 运算 符 常用 于 Python 的 


条 件 判断 。 条 件 判断 会 在 第 4 章 详细 讲述 ， 现 在 首先 了 解 与 或 非 的 逻辑 判断 ， 具 体 说 明 如 
表 2-4 所 示 。 
表 2-5 ”Python 的 逻辑 运算 符 
运算 符 描 述 实 例 
如 xandy， 若 x 或 y 为 False， 则 返回 False False and 10， 返 回 False 
And (与 ) 若 x 和 y 皆 为 True， 则 返回 True True and True， 返 回 True 
若 x 和 y 皆 为 数字 ， 则 返回 最 大 的 数值 10 and 20， 返 回 20 
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( 续 表 ) 
运算 符 描 述 实 例 
如 xory， 若 x 或 y 为 Tme， 则 返回 True False or 10， 返 回 10 
Or (或 ) 若 x 和 Yy 皆 为 False， 则 返回 False False or True， 返 回 True 
若 x 和 y 皆 为 数字 ， 则 返回 最 小 的 数值 10or20， 返 回 10 
ders 如 notx， 若 x 为 True， 则 返回 False not False， 返 回 True 
若 x 为 False， 则 返回 Tme not True， 反 正 False 
逻辑 运算 符 的 与 或 非 需要 两 个 对 象 进行 逻辑 判断 ， 这 两 个 对 象 可 以 是 任意 的 数据 类 
型 。 读 者 有 兴趣 的 话 ， 可 以 自行 研究 多 种 数据 类 型 组 合 的 逻辑 判断 结果 。 我 们 通过 代码 简 
单 演示 逻辑 运算 符 ， 代 码 如 下 : 


性 ， 
组 、 
辑 关 


2.3. 


RILgeS 
y= ,ai 
print (' 与 运算 符 : '，x and y) 
print (' 或 运算 符 : '，x or y) 
print (' 非 运算 符 : '，not x) 
变量 x 和 y 的 数据 类 型 分 别 为 布尔 型 和 字符 串 ， 逻 辑 运算 符 会 首先 判断 对 象 的 真 假 
如 变量 y， 如 果 是 空 的 字符 串 ， 则 返回 False， 非 空 的 字符 串 就 返回 True， 同 理 ， 元 
列表 和 字典 与 字符 串 的 判断 逻辑 是 相同 的 ， 最 后 根据 两 个 对 象 的 真 假 执行 与 或 非 的 轴 
断 。 将 上 述 代码 在 PyCharm 里 运行 ， 运 行 结果 如 图 2-7 所 示 。 

与 运算 符 : 

或 运算 符 : 


非 运算 符 : 


图 2-7 逻辑 运算 符 的 输出 结果 


5 ”位 运算 符 
位 运算 符 是 将 数值 转换 为 二 进 制 进行 计算 ， 我 们 无 需 将 数值 转换 二 进 制 ， 只 需 对 数值 


使 用 


位 运算 符 ，Python 会 自动 将 数值 转换 二 进 制 计算 并 将 计算 结果 转换 成 十 进 制 。 位 运算 


符 如 


表 2-6 所 示 。 


表 2-6 ”Python 的 位 运算 符 


实 例 


按 位 与 运算 符 。 参 与 运算 的 两 个 值 ， 如 果 两 个 相应 位 | (60 & 13) 输出 结果 12 ， 二 进 制 为 
都 为 1， 则 该 位 的 结果 为 1， 否则 为 0 0000 1100 
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( 续 表 ) 
运算 符 | 描 述 实 例 

| 按 位 或 运算 符 。 只 要 对 应 的 二 个 二 进位 有 一 个 为 1 时 ，| (60 | 13) 输出 结果 61 ， 二 进 制 为 
结果 就 为 1 0011 1101 

人 按 位 异 或 运算 符 。 当 两 对 应 的 二 进位 相 异 时 ， 结 果 | (60 ^13) 输出 结果 49 ， 二 进 制 为 
为 1 0011 0001 


按 位 取 反 运算 符 。 对 数据 的 每 个 二 进 制 位 取 反 ， 即 把 
1 变 为 0， 把 0 变 为 1 


(~60) 输出 结果 -61 ， 二进制 为 1100 


0011 


左 移动 运算 符 。 将 二 进位 全 部 左 移 若干 位 ， 由 "<<" 右 


60 << 2 输出 结果 240 ， 二 进 制 为 


边 的 数 指定 移动 的 位 数 ， 高 位 丢弃 ， 低 位 补 0 1111 0000 
区 右 移动 运算 符 。 将 二 进位 全 部 右 移 若 干 位 ， 由 ">>" 右 | 60 >> 2 输出 结果 15 ， 二 进 制 为 


边 的 数 指定 移动 的 位 数 


0000 1111 


我 们 通过 代码 的 形式 来 讲述 位 运算 符 的 具体 使 用 方式 ， 代 码 如 下 : 


X = 60 

y= 13 

print ('& 运 算 符 : '，x & y) 
Print (' | 运算 符 : '，x | y) 
print ('^ 运 算 符 : '，x ^ y) 
Print ('~ 运 算 符 : '，~x) 
print ("<< 运 算 符 ; '，x << 2) 
print ('>> 运 算 符 : '，x >> 2 ) 


二 进 制 数 据 是 用 0 和 1 来 表示 的 数值 。 它 的 基数 为 2， 进 位 规则 是 逢 二 进 一 ， 借 位 规则 
是 借 一 当 二 。 由 于 Python 是 解释 性 编程 语言 ， 因 此 位 运算 符 在 实际 开发 中 使 用 频率 相对 较 
少 ， 读 者 可 做 了 解 。 在 PyCharm 中 运行 上 述 代码 ， 运 行 结果 如 图 2-8 所 示 。 


& 运 算 符 : 
| 运算 符 : 
“运算 符 : 


“运算 符 : 
运算 符 : 2 
运算 符 : 


图 2-8 位 运算 符 的 输出 结果 


2.3.6 成 员 运 算 符 


成 员 运算 符 主 要 是 判断 字符 串 、 元 组 、 列 表 或 字典 里 是 


True 或 False 表示 。Python 的 成 员 运 算 符 如 表 2-6 所 示 。 


否 包 含 某 个 成 员 ， 返 回 结果 以 
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表 2-7 成员 运算 符 


实 例 


若 x 在 y 序 列 中 , 则 返回 True, 否则 返回 False 


找到 值 ， 返 回 Trme， 否 


如 果 在 指定 的 序列 中 
则 返回 False 

如 果 在 指定 的 序列 中 没有 找到 值 ,返回 True， 
否则 返回 False 


车 x 在 y 序列 中 ， 则 返回 False， 否 则 返回 


Tme 


我 们 以 字符 串 和 列表 来 演示 成 员 运 算 符 的 操作 ， 具 体 代 码 如 下 : 


xX = "hello world’ 

a 

print ('in 运算 符 : '，'hello' in x) 
Print('not in 运算 符 : '，2 not in y) 


上 述 代 码 在 PyCharm 中 运行 ， 运 行 结果 如 图 2-9 所 示 。 


: True 


not in 运 算 符 : False 


图 2-9 成 员 运 算 符 的 输出 结果 


2.3.7 ”身份 运算 符 

身份 运算 符 是 比较 两 个 对 象 的 存储 单位 是 否 一 致 ， 两 个 对 象 可 以 为 任意 的 数据 类 型 、 
函数 和 类 等 任意 形式 。Python 的 身份 运算 符 如 表 2-8 所 示 。 

表 2-8 Python 的 身份 运算 符 

实 例 
如 果 引 用 的 是 同一 个 对 象 则 返回 True， 和 否则 返回 
False 
如 果 引 用 的 不 是 同一 个 对 象 则 返回 结果 True, 否则 
返回 False 


运算 符 | 描 述 


Is 判断 两 个 变量 是 不 是 引用 自 一 个 对 象 


is not 判断 两 个 变量 是 不 是 引用 自 不 同 对 象 


如 果 两 个 变量 的 值 是 完全 相同 的 ， 则 说 明 这 两 个 变量 是 来 自 同一 个 对 象 ， 否 则 是 来 自 
不 同 对 象 。 我 们 通过 代码 的 形式 来 加 以 说 明 ， 代 码 如 下 : 


= 
= 
print ('is 运算 符 : '， x is y) 
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Y= 20 
print ('is not 运算 符 : '，x is not y) 


当 变 量 x 和 y 的 值 相同 的 时 候 ， 则 两 者 是 引用 同一 个 对 象 ， 使 用 is 运算 符 输出 的 结果 


为 Tme; 若 改 变 变 量 y 的 值 ， 两 个 变量 就 各 自 引 用 不 同 的 对 象 ， 使 用 is not 运 算 符 将 输出 的 
结果 为 True。 运 行 结果 如 图 2-10 所 示 。 


is 运算 符 : True 


is not 运 算 符 : True 


图 2-10 身份 运算 符 的 输出 结果 


2.3.8 运算 符 的 优先 级 


运算 符 的 优先 级 别 是 指 在 一 个 Python 语句 里 ， 若 包含 两 种 或 以 上 的 运算 符 ， 运 算 符 会 
根据 优先 级 高 低 依次 执行 运算 顺序 。 表 2-8 从 高 到 低 列 出 了 所 有 运算 符 的 优先 级 。 


表 2-9 运算 符 的 优先 级 


运算 符 描 述 

站 让 指数 〈 算 术 运 算 符 ) 

~ 十 - 按 位 取 反 运算 符 〈 位 运算 符 )、 加 号 〈 代 表 正 数 )、 减 号 〈 代 表 负 数 ) 
*/%// 乘 、 除 、 取 模 和 取 整 除 〈 算 术 运算 符 ) 
+- 加 法 、 减 法 (算术 运算 符 ) 

>> << 右 移 ， 左 移 运算 符 〈 位 运算 符 ) 

& 位 运算 符 

^| 位 运算 符 

= 比较 运算 符 

二 二 上 = 比较 运算 符 

=%= 三 /三 二 本 *= 地 = 赋值 运算 符 

js is not 身份 运算 符 

in not in 成 员 运 算 符 

not or and 逻辑 运算 符 
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本 章 主要 讲述 变量 的 命名 与 使 用 、 变 量 的 深浅 拷贝 以 及 运算 符 的 使 用 。 在 讲述 这 三 个 
知识 点 的 时 候 ， 涉 及 到 Python 的 数据 类 型 ， 如 数字 、 字 符 串 、 布 尔 型 、 元 组 、 列 表 和 字典 
等 。 对 于 初学 者 来 说 ，Python 的 数据 类 型 有 点 陌生 ， 通 过 本 章 的 学 习 ， 读 者 有 个 大 致 的 了 
解 即 可 。 

变量 的 命名 需要 遵循 变量 的 命名 规则 ;而 变量 的 使 用 首先 对 变量 直接 赋值 ， 通 过 赋值 
相当 于 对 变量 进行 定义 和 声明 其 数据 类 型 。 如 果 对 已 有 的 变量 重新 赋值 ， 则 表示 对 变量 重 
新 进行 定义 和 声明 。 

变量 的 深浅 拷贝 分 为 深 拷 贝 和 浅 拷 贝 ， 只 适用 于 变量 值 为 列表 或 字典 的 变量 。 读 者 要 
掌握 深 堵 贝 和 浅 拷贝 的 区 别 以 及 两 者 的 拷贝 方式 。 

Python 的 运算 符 共 有 7 类 ， 分 别 为 
算术 运算 符 : 计算 两 变量 的 加 减 乘除 等 计算 法 则 。 
比较 (关系 ) 运算 符 : 比较 两 个 变量 的 大 小 情况 。 
赋值 运算 符 : 先 计 算 后 赋值 到 新 的 变量 。 
逻辑 运算 符 : 与 或 非 的 逻辑 判断 。 

位 运算 符 : 把 数值 看 成 二 进 制 来 进行 计算 。 

成 员 运算 符 : 判断 字符 串 、 元 组 、 列 表 或 字典 中 是 否 含有 成 员 。 

身份 运算 符 : 用 于 比较 两 个 对 象 的 存储 单位 ， 比 如 判断 变量 a 和 b 在 计算 机 内 存 地 址 是 
否 一 致 。 


不 同 的 运算 符 有 不 同 的 优先 级 别 ， 掌 握 运 算 符 的 优先 级 别 是 编写 高 质 代码 的 基础 。 


本 章 主要 讲述 Python 的 数据 类 型 ， 包 括 :数字 、 字 符 串 、 元 组 、 列 表 、 集 合 和 字典 。 闸 
述 每 种 数据 类 型 的 数据 格式 和 使 用 方法 及 其 各 种 数据 类 型 之 间 的 相互 转换 方法 。 


3.1 数字 的 类 型 及 转换 


在 第 2 章 ， 我 们 已 经 提 及 到 数字 这 一 数据 类 型 ， 其 主要 以 阿拉 伯 数 字 的 形式 表示 。 数 
字 可 以 细 分 为 整 型 、 浮 点 型 、 布 尔 型 和 复数 ， 具 体 说 明 如 下 : 


(1) 整 型 是 没有 小 数 点 的 数值 。 
(2) 浮 点 型 是 带 有 小 数 点 的 数值 。 
(3) 布尔 型 以 True 和 False 表示 ， 实 质 分 别 为 1 和 0， 为 区 分 整 型 的 1 和 0， 而 改 为 
True 和 False。 
(4) 复数 是 由 一 个 实数 和 一 个 虚数 组 合 构成 ， 可 以 用 x+yj 或 者 complex(x,y) 表 示 。 


现在 通过 代码 的 形式 表示 这 4 种 数据 类 型 ， 代 码 如 下 


10 

D3 
False 
| 


on op 


print (type (a) ，type (b) ，type(c) ，type(d) ) 
# 输出 结果 为 : <class 'int'> <class 'float'> <class 'bool'> <class 'complex'> 


我 们 可 以 使 用 特定 的 方法 将 4 种 数据 类 型 进行 相互 转换 ， 具 体 通过 代码 的 形式 加 以 说 明 : 


= 10 
= 5.5 
=,"False 


on op 
1 


=2+3] 
Print (type(a) ，type (b) ，type(c)，type(d) ) 


## 整 型 分 别 转 成 浮 点 型 、 布 尔 型 和 复数 
print (' 整 型 转 浮 点 型 : '，float (a)) 
Print (' 整 型 转 布尔 型 :'，bool (a)) 
print (' 整 型 转 复数 ; '，complex (a)) 


# 浮 点 型 分 别 转 成 整 型 、 布 尔 型 和 复数 
print (' 浮 点 型 转 整数 : '，int (b)) 
print (' 浮 点 型 转 布 尔 型 : '，bool1 (1.0)) 
print (' 浮 点 型 转 复 数 : '， complex (b) ) 


# 布尔 型 分 别 转 成 整 型 、 浮 点 型 和 复数 
print ( "布尔 型 转 整 数 : '，int (c)) 
print (' 布 尔 型 转 浮 点 型 : '，float (c) ) 
print (' 布 尔 型 转 复数 : '，complex (c)) 


# 复数 只 能 转换 布尔 型 

print ('" 复 数 转 布尔 型 : "，bool(d) ) 

上 述 代码 中 ， 整 型 、 浮 点 型 和 布尔 型 是 可 以 相互 转换 的 ， 而 复数 就 只 能 转换 为 布施 
型 ， 不 支持 整 型 和 浮 点 型 的 转换 。 代 码 的 输出 结果 如 图 3-1 所 示 。 


class ‘int'> <class 'float” class 'bool’ class“complex 


从 


转 布尔 型 ， True 


转 复数 : 〈5. 5+0j) 
布尔 型 转 整数 : 0 
布尔 型 转 浮 点 型 : 0.0 
布尔 型 转 复数 : 0j 
复数 转 布尔 型 True 


图 3-1 数据 类 型 的 转换 结果 
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3.2 ”字符 串 的 定义 及 使 用 


3.2.1 字符 串 的 定义 


字符 串 〈String) 是 由 数字 、 字 母 、 下 划 线 组 成 的 一 串 字 符 ， 它 是 编程 语言 中 表示 文本 
的 数据 类 型 ， 主 要 用 于 编程 、 概 念 说 明和 函数 解释 等 。 字 符 串 在 存储 上 类 似 字 符 数 组 ， 所 
以 每 一 位 的 单个 元 素 都 可 以 提取 。 

Python 的 字符 串 可 以 用 单 引 号 、 双 引号 或 三 引号 来 表示 。 如 果 字 符 串 中 含有 单 引 号 
可 以 使 用 双 引 号 或 三 引号 来 表示 字符 串 ， 如 果 字 符 串 中 含有 双 引 号 ， 可 以 使 用 单 引号 或 三 
引号 表示 字符 串 ; 如 果 字 符 串 中 含有 单 引 号 和 双 引 号 ， 可 以 使 用 转 义 字符 或 三 引号 表示 字 
符 串 。 我 们 通过 代码 的 形式 加 以 说 明 ， 代 码 如 下 : 


单 引号 、 双 引号 和 三 引号 的 表示 方式 

= "Hello Python" 

= "Hel1lo Python’' 

= """Hello Python""" 

字符 串 含义 双 引 号 的 表示 方式 

= "Hello "Python"" 

"smhollo “TE Tove. Python sn" 

字符 串 含 义 单 引号 的 表示 方式 

= "Hello 'I' love Python" 

= SLLo "TL Love” python™™™ 
字符 串 含义 单 引号 和 双 引 号 的 表示 方式 

= WoLLo OO7er python 
= "Hello "I"” \'love\' Python'" 

= "Hello \"I\" \'love\' Python" 


Dn 
民 1 


转 义 字符 是 一 种 特殊 的 字符 常量 ， 它 是 以 反 斜 线 开头， 后 面 跟 一 个 或 几 个 字符 。 转 
义 字 符 具 有 特定 的 含义 ， 用 于 区 别 字 符 原 有 的 意义 ， 故 称 转 义 字符 。Python 常用 的 转 义 字 
符 如 表 1-9 所 示 。 


+ 


表 3-1 Python 转 义 字 符 


转 义 字 符 意 义 
\a 响 铃 (BEL) 


\b 退 格 (BS)， 将 当前 位 置 移 到 前 一 列 
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( 续 表 ) 
转 义 字符 意 ) 六 
¥ 换 页 (FF)， 将 当前 位 置 移 到 下 页 开头 
un 换行 (LF)， 将 当前 位 置 移 到 下 一 行 开头 
Yr 可 车 〈CR)， 将 当前 位 置 移 到 本 行 开头 
\t 水 平 制 表 (HT)〉( 跳 到 下 一 个 TAB 位 置 ) 
Ww 垂直 制 表 (VT) 
\ 代表 一 个 反 斜 线 字 符 \ 
由 代表 一 个 单 引号 字符 
et 代表 一 个 双 引 号 字符 
by 代表 一 个 问号 
‘0 空 字 符 (NULL) 
\ooo 1 到 3 位 八进制 数 所 代表 的 任意 字符 
\xhh 1 到 2 位 十 六 进 制 所 代表 的 任意 字符 


现在 ， 我 们 对 字符 串 的 定义 已 有 一 定 的 了 解 ， 接 下 来 学 习 字符 串 的 操作 。 字 符 串 操作 
需要 依赖 特定 的 函数 方法 才能 实现 ， 常 用 的 字符 串 操 作 有 截取 、 替 换 、 查 找 、 分 割 和 


拼接 。 


3.2.2 ”字符 串 截 取 
截取 格式 为 :; 
字符 串 [开始 位 置 : 结 束 位 置 :间隔 位 置 ] 
开始 位 置 是 9， 正 数 代表 从 左边 位 置 开始 ， 负 数 代表 从 右边 位 置 开始 ， 默 认 代 表 从 0 开 


始 。 结 束 位 置 是 被 截取 的 字符 串 位 置 ， 空 值 默认 取 到 字符 


尾部 。 间 隔 位 置 默认 为 1， 截 


取 的 内 容 不 做 处 理 ， 如 果 设 置 为 2， 就 将 截取 的 内 容 再 隔 一 取 数 。 
示例 如 下 : 
# 字符 串 截取 


SEE 一 


"ABCDEFG " 


# 截取 第 一 位 到 第 三 位 的 字符 

print (' 截 取 第 一 位 到 第 三 位 的 字符 : ' + str[0:3:]) 
# 截取 字符 串 的 全 部 字符 

print ('" 截 取 字 符 串 的 全 部 字符 : ' + str[::]) 

# 截取 第 七 个 字符 到 结尾 

print (' 截 取 第 七 个 字符 到 结尾 : ' + str[6::]) 


30 | Python 自动 化 开发 实战 


# 截取 从 头 开始 到 倒数 第 三 个 字符 之 前 

print ( "截取 从 头 开始 到 倒数 第 三 个 字符 之 前 : ' + str[:-3:]) 
# 截取 第 三 个 字符 

print (' 截 取 第 三 个 字符 : ' + str[2]) 

# 截取 倒数 第 一 个 字符 

print ( "截取 倒数 第 一 个 字符 : ' + str[-1]) 

# 与 原 字 符 串 顺 序 相反 的 字符 串 

Print (' 与 原 字 符 串 顺序 相反 的 字符 串 : ' + str[::-1]) 

# 截取 倒数 第 三 位 与 倒数 第 一 位 之 前 的 字符 

print ( "截取 倒数 第 三 位 与 倒数 第 一 位 之 前 的 字符 : ' + str[-3:-1:]) 
# 截取 倒数 第 三 位 到 结尾 

print (' 截 取 倒数 第 三 位 到 结尾 : ' + str[-3::]) 

# 逆序 截取 

print (' 道 序 截 取 : ' + str[:-5:-3]) 


3.2.3 ”字符 串 蔡 换 
蔡 换 方法 为 : 
字符 申 .replace (" 被 蔡 换 内 容 "， "替换 后 内 容 ') 


要 注意 的 是 ， 使 用 replace 蔡 换 字符 串 后 仅 为 临时 变量 ， 需 重新 赋值 才能 保存 。 
示例 如 下 : 


str = "ABCRBCRBC 

# 单个 内 容 葵 换 

print (str.replace('Cc', 'V')) 
# 输出 内 容 : ABVABVABV 


# 字符 串 蔡 换 

print (str.replace('BC', 'WV')) 
# 输出 内 容 : AWVAWVAWV 

# 蔡 换 成 特殊 符号 (空格 ) 

print (str.replace('BC', ' ')) 
# 输出 内 容 : A A A 


3.2.4 字符 串 查找 元 素 
查找 方法 为 : 
字符 串 .find(' 要 查找 的 内 容 ，[， 开 始 位 置 ,结束 位 置 ]) 


开始 位 置 和 结束 位 置 表示 要 查找 的 范围 ， 若 为 空 值 ， 则 表示 查找 所 有 。 找 到 目标 后 会 
目标 第 一 位 内 容 所 在 的 位 置 ， 位 置 从 0 开始 算 ， 如 果 没 找到 ， 就 返回 -1。 

示例 如 下 : 

str = "ABCDRABC" 

# 查找 全 部 


print (str.find('A')) 
# 输出 内 容 : 0 


# 从 字符 串 第 4 个 开始 查找 
print (str find( ny 3)) 
# 输出 内 容 : 4 


# 从 字符 串 第 2 个 到 第 6 个 开始 查找 ， 即 从 'BCDAB' 中 查找 'C' 
站 SEE CT 

# 输出 内 容 : 2 

# 查找 不 存在 的 内 容 

printtstr. find("E)) 

# 输出 内 容 : -1 


除了 使 用 find 函数 查找 字符 串 中 某 个 内 容 ， 使 用 index 函数 也 能 实现 同样 的 功能 。 
index 是 在 字符 串 里 查找 子 串 第 一 次 出 现 的 位 置 ， 类 似 于 字符 串 的 find 方法， 如 果 查 找 不 到 
子 串 ， 就 会 抛 出 异常 ， 而 不 是 返回 -1。 

示例 如 下 : 


返 


互 


str = 'ABCDABC' 
# 查找 全 部 
print (str.index('A')) 


# 输出 内 容 : 0 


# 从 字符 串 第 4 个 开始 查找 
print (str.index('A', 3)) 
# 输出 内 容 : 4 


# 从 字符 串 第 2 个 到 第 6 个 开始 查找 
print(str- index(nC Te Sy 
# 输出 内 容 : 2 


井 查找 不 存在 的 内 容 
print (str.index('E')) 
# 输出 内 容 : ValueError: substring not found 
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3.2.5 ”字符 串 分 割 
分 割 方法 为 : 
字符 串 .split (" 分 割 符 ， 分 割 次 数 ) 


如 果 存 在 分 割 次 数 ， 就 仅 分 割 成 “分 割 次 数 +1” 个 子 字符 串 ， 如 果 为 空 ， 就 默认 全 部 


分 割 。 分 割 后 ， 返 回 结果 以 列表 表示 。 
示例 如 下 : 


str = "ABCDABC!' 

# 分 割 全 部 

print (str.split('B')) 

# 输出 内 容 : ['A'，'CDA'，'C'] 
# 分 割 一 次 

Drint(lstr: split( eB LD 

# 输出 内 容 : ['A'，'CDABC'] 


3.2.6 ”字符 串 拼接 


字符 串 拼接 有 5 种 实现 方式 ， 使 用 加 号 拼接 、 使 用 逗号 拼接 、 直 接 拼接 、 格 式 化 拼接 


和 join 方法 拼接 。 具 体 的 拼接 方式 如 下 所 示 : 


str = 'Hello Python' 

print (' 第 一 种 方式 通过 加 号 形式 拼接 : ' + str) 

print (' 第 二 种 方式 通过 逗号 形式 拼接 : ' ， stz) 

print (' 第 三 种 方式 通过 直接 拼接 形式 : ' 'Hello'' Python') 
print (' 第 四 种 方式 通过 格式 化 形式 拼接 : ' + "ss' gs(str) ) 
str list = ['Hello', 'Python'] 

Str = Join(tstr 1ist) 


print (' 第 五 种 方式 通过 join 形式 拼接 : ' + str) 


3.3 ”元 组 与 列表 


元 组 和 列表 是 两 个 非常 相似 的 亲 兄 弟 ， 两 者 在 表现 形式 上 有 所 不 同 ， 


其 最 大 的 


区 别 的 是 


元 组 在 定义 之 后 无 法 修改 ， 只 能 读 取 ， 而 列表 则 支持 修改 和 读 取 。 在 第 2 章 曾 经 讲 过 ， 列 表 


好 比 人 们 排队 购 票 ， 队 伍 中 的 每 个 人 就 如 列表 里 面 的 每 个 元 素 ， 元 组 也 是 如 


此 。 
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元 组 使 用 小 括号 来 定义 ， 而 列表 使 用 中 括号 来 定义 。 元 组 列表 里 面 的 元 素 可 以 是 任意 
的 数据 类 型 ， 每 个 元 素 之 间 使 用 英文 逗号 隔 开 ;， 如 果 元 组 和 列表 中 没有 元 素 ， 说 明 这 是 一 
个 空 的 元 组 或 列表 。 下 面 我 们 在 代码 中 分 别 定义 元 组 和 列表 : 

tupls 1l = (1, "python, Falser S55 (ly 27 4), ["Hello" 31) (元 组 ) 

Te Python Ealse ob (lo A Teo 3 (列表 ) 


从 元 组 和 列表 的 定义 来 看 ， 两 者 的 元 素 是 一 致 的 ， 元 素 的 数据 类 型 可 以 是 整 型 、 字 符 
串 、 布 尔 型 、 浮 点 型 、 元 组 和 列表 。 如 果 元 素 是 一 个 元 组 或 列表 ， 那 么 这 是 一 种 柑 套 模 
式 ， 这 种 模式 在 日 常 的 开发 中 很 常见 。 值 得 注意 的 是 ， 如 果 定 义 元 组 的 时 候 ， 只 有 一 个 元 
素 ， 则 必须 在 元 素 后 加 有 逗号， 否则 Python 会 将 小 括号 视 为 运算 法 则 的 小 括号 ， 如 (1,)。 

定义 了 元 组 和 列表 之 后 ， 接 下 来 我 们 介绍 如 何 对 元 组 列表 进行 操作 处 理 。 元 组 和 列表 
的 读 取 操 作 是 通过 下 标 索引 进行 定位 读 取 ， 下 标 索引 是 从 0 开始 ， 代 表 是 第 一 个 元 素 。 根 
据 上 述 定义 的 tuple_ 1 和 list_ 1， 具 体 的 读 取 方法 如 下 : 


# 读 取 tuple 1 的 元 素 

print (' 读 取 元 组 第 一 个 元 素 : '，tuple_1[0]) 
print (' 读 取 元 组 第 二 个 元 素 : '，tuple 1[1]) 
print (' 读 取 元 组 倒数 第 二 个 元 素 : '，tuple 1[-2]) 
print (' 读 取 元 组 倒数 第 一 个 元 素 : '，tuple 1[-1]) 
# 读 取 1ist_1 的 元 素 

print (' 读 取 列 表 第 一 个 元 素 : '，1ist 1[0]) 
print (' 读 取 列 表 第 二 个 元 素 : '，1ist 1[1]) 
print (' 读 取 列 表 倒 数 第 二 个 元 素 : '，1ist 1[-2]) 
print (' 读 取 列 表 倒数 第 一 个 元 素 : '，1ist_1[-1]) 


下 标 索 引 从 0 开始 并 以 正 数 方式 表示 ， 代 表 从 元 组 列表 的 左边 开始 读 取 ; 如 果 下 标 索 
引 以 负数 表示 ， 代 表 从 元 组 列表 的 右边 开始 读 取 。 上 述 代 码 运算 结果 如 图 3-2 所 示 。 
读 取 元 组 第 一 个 元 素 : 1 
读 取 元 组 第 二 个 元 素 : Python 
读 取 元 组 倒数 第 二 个 元 素 : (1，2, 少 
读 取 元 组 倒数 第 一 个 元 素 : [ Hello ，3] 


读 取 列表 第 一 个 元 素 : 1 

读 取 列表 第 二 个 元 素 : Python 

读 职 列表 倒数 第 二 个 元 素 : (1，2， 纪 
读 职 列表 倒数 第 一 个 元 素 : [’ Hello’ ，3] 


图 3-2 元 组 列表 的 读 取 结果 
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除了 读 取 某 个 元 素 值 ， 还 可 以 读 取 元 组 和 列表 中 的 连续 几 个 元 素 ， 并 将 其 生成 一 个 新 


的 元 组 或 列表 。 简 单 理解 就 是 将 元 组 或 列表 进行 切 块 读 取 ， 切 块 后 的 数据 以 原 有 的 数据 类 
型 表示 ， 有 具体 实现 代码 如 下 : 


# 读 取 tuple_1 的 部 分 元 素 

print (' 读 取 元 组 第 一 个 到 第 四 个 元 素 : '，tuple 1[0:4]) 

Print (' 读 取 元 组 倒数 第 四 个 到 倒数 第 一 个 元 素 : '，tuple_1[-4:-1]) 

Print (" 获 取 元 组 倒数 第 四 个 到 倒数 第 一 个 元 素 并 隔 一 读 取 : '，tuple 1[-4:-1:2]) 
# 读 取 1ist_1 的 部 分 元 素 

print (' 读 取 列 表 第 一 个 到 第 四 个 元 素 : '，1ist 1[0:4]) 

print (' 读 取 列 表 倒 数 第 四 个 到 倒数 第 一 个 元 素 : '，1ist 1[-4:-1]) 

print ('" 获 取 列 表 倒数 第 四 个 到 倒数 第 一 个 元 素 并 隔 一 读 取 : '，1ist 1[-4:-1:2]) 


从 上 述 的 代码 可 以 发 现 ， 元 组 列表 的 切换 读 取 与 字符 串 的 截取 方法 是 十 分 相似 的 ， 两 


者 实质 都 是 同一 个 方法 ， 只 不 过 对 象 的 数据 类 型 有 所 不 同 而 已 。 上 述 代 码 运 算 结 果 如 图 
3-3 所 示 。 


读 取 元 组 第 一 个 到 第 四 个 元 素 : 〈1， "Python ，False，5.5) 
读 取 元 组 倒数 第 四 个 到 倒数 第 一 个 元 素 : (False，5.5，(1， 
获取 元 组 倒数 第 四 个 到 倒数 第 一 个 元 素 并 隔 一 读 职 : (False，(1， 


读 取 列表 第 一 个 到 第 四 个 元 素 : [1， "Python  ，False，5.5] 
读 取 列表 倒数 第 四 个 到 倒数 第 一 个 元 素 : [False，5.5，(1， 
获取 列表 倒数 第 四 个 到 倒数 第 一 个 元 素 并 隔 一 读 职 : [False，(1，2， 习 ] 


图 3-3 元 组 列表 的 切 块 读 取 结 果 
除了 通过 下 标 索引 来 读 取 元 组 和 列表 ， 此 外 还 能 通过 元 素 值 来 找到 相应 的 下 标 索引 、 


统计 元 素 值 的 出 现 次 数 、 判 断 元 素 是 否 存在 元 组 或 列表 以 及 获取 元 组 和 列表 的 总 长 度 。 这 
都 是 一 些 日 常 开发 中 最 为 常用 的 方法 ， 实 现 方法 如 下 : 


tuple lL = (lr Python, Falser Sa (ly Zr A) Helloy J “python 
ee en en oa ee 


# 通过 元 素 值 查找 下 标 索 引 

# 默认 搜索 整个 元 组 ， 并 返回 元 素 Python 第 一 次 出 现 的 下 标 索 引 

print (' 元 组 的 元 素 Python 的 下 标 索引 为 : '，tuple 1.index('Python')) 

# 在 index 设置 4，7 是 将 元 组 定位 到 第 4 个 到 第 7 个 元 素 区 间 

# 然后 在 这 个 区 间 查 找 元 素 值 Python 的 下 标 索 引 

print (' 元 组 第 二 个 元 素 的 下 标 索 引 为 : '，tuple 1.index('Python', 4, 7)) 
print (' 列 表 的 元 素 值 (1，2，4) 的 下 标 索 引 为 : '，1ist 1.index((1，2，4))) 
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# 统计 元 素 的 出 现 次 数 
print (' 元 组 的 元 素 出 现 次 数 为 :，'， tuple 1.count('Python')) 


# 判断 元 素 值 是 否 存在 元 组 或 列表 中 
print (' 元 组 是 否 存在 元 素 Python: '， "Python' in tuple 1) 
print (' 列 表 是 否 存在 元 素 love: '，'love' in list 1) 


## 获取 元 组 和 列表 的 总 长 度 
print (' 元 组 的 总 长 度 为 : '，len (tuple 1)) 
print (' 列 表 的 总 长 度 为 : '，len (list 1)) 


代码 主要 对 元 组 或 列表 使 用 index 函数 、count 函数 、in 运算 符 和 len 函数 即 可 实现 下 
标 索 引 查 找 、 元 素 值 的 出 现 次 数 、 元 素 值 的 存在 判断 以 及 元 组 和 列表 长 度 获取 。 运 行 结果 
如 图 3-4 所 示 。 


元 组 的 元 素 Python 的 下 标 索 引 为 : 1 

元 组 第 二 个 元 素 的 下 标 索 引 为 : 6 
列表 的 元 素 值 (1，2，4) 的 下 标 索 引 为 : 4 
元 组 的 元 素 出 现 次 数 为 : 2 


元 组 是 否 存 在 元 素 Python: True 
列表 是 否 存 在 元 素 love: False 
元 组 的 总 长 度 为 : 7 
列表 的 总 长 度 为 : 6 


图 3-4 元 组 和 列表 的 常用 函数 输出 结果 


上 述 内 容 主 要 讲述 元 组 和 列表 的 读 取 方 式 以 及 常用 查询 方式 ， 下 一 步 是 对 列表 进行 修 
改 处 理 。 列 表 的 修改 方式 有 修改 元 素 、 添 加 元 素 和 删除 元 素 。 有 具体 的 修改 方式 通过 以 下 代 
码 来 加 以 讲述 : 


en nl python ralse oo (1 2 A) Teno 3 


# 通过 下 标 索 引 修改 某 个 元 素 值 
list 1[1] = 'Love Python' 
print (' 下 标 索 引 修改 元 素 值 : '，1ist 1) 


# 添加 元 素 有 四 种 方法 : append 函数 、extend 函数 、insert 函数 、 列 表 相 加 
# append 是 在 列表 的 末端 追加 元 素 ， 将 列表 作为 一 个 整体 进行 追加 

list 1.append('Hello') 

print ('append 函数 : '，1ist 1) 
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# extend 是 将 列表 中 每 个 元 素 分 别 添 加 到 另 一 个 列表 中 。 

# 如 添加 ~Worlq” 字 符 串 ， 则 将 字符 串 生成 列表 ['World"'] ， 然 后 连接 到 列表 1ist_1 
list 1.append('World') 

print ('extend 函数 : '，1ist 1) 


# insert 是 在 指定 的 下 标 索 引 前 面 添加 元 素 ， 如 第 三 个 元 素 前 面 添 加 “Love” 字 符 串 
list 1.insert(2, 'love') 
print ('insert 函数 : '，1list 1) 


# 列表 相 加 将 两 个 1ist 相 加 ， 并 生成 一 个 新 的 1ist 对 象 
| 

it 3 .List 二 二 1st 这 

print (' 列 表 相 加 : '，1ist 3) 


# 通过 元 素 值 删除 元 素 ， 如 删除 元 素 值 False 的 元 素 
list 1.remove (False) 


print (' 通 过 元 素 值 删除 元 素 : '，1ist _1) 


# 通过 下 标 索引 删除 元 素 ， 如 删除 最 后 一 个 元 素 
1 Lpop( = 
Print (' 通 过 下 标 索 引 删 除 元 素 : '，1ist 1) 


# del 函数 删除 元 素 

# 通过 下 标 索 引 删除 ， 如 删除 第 二 个 元 素 
del list 1[1] 

print (' del 删除 元 素 方 法 1: ',1ist_1) 


# 通过 范围 区 间 删 除 ， 如 删除 第 一 个 到 第 三 个 的 元 素 
del list 1[0:2] 
print ('del 删除 元 素 方法 2: ',1ist 1) 


# 删除 整个 列表 

del list 1 

上 述 代码 分 别 对 列表 进行 修改 、 新 增 和 删除 操作 。 列 表 修 改 只 需 对 某 个 元 素 值 重 新 赋值 
即 可 ; 添加 元 素 主 要 有 4 种 实现 方式 : append 函数 、extend 函数 、insert 函数 和 列表 相 加 ; 删 
除 元 素 有 三 种 删除 方式 : remove 函数 、pop 函数 和 del 函数 。 运 行 结 果 如 图 3-5 所 示 。 
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下 标 索 引 修 改元 素 值 ， [1，’Love Python" ，False，5.5，(1，2，4)，[ Hello ，3]] 

append 函 数 ; [1，"Love Python’, False, 5.5, (1, 2, 4), [’Hello’, 3], ’Hello’] 

extend 函 教 ， [1,，’Love Python’, False, 5.5, (1, 2, 4), [’Hello’, 3], 'Hello’, 'World’] 

insert 函 数 ; [1,，’Love Python’,，'love’, False, 5.5, (1, 2, 4), [’Hello’, 3], ’Hello’, ’World’] 

列表 相 加 : [1，' Love Python’,，’love’, False, 5.5, (1, 2, 4), [’Hello’, 3], ’Hello’, ’World’, 1, 2, 3] 


通过 元 素 值 删除 元 素 : [1，’Love Python’,'love’, 5.5, (1, 2, 4),[’Hello’, 3], ’Hello’, 'World'] 
通过 下 标 索 引 删 除 元 素 : [1，' Love Python’,'love’, 5.5, (1, 2, 4), ['Hello’, 3], 'Hello’] 
del 删 除 元 素 方法 1l: [1，’ love" ，5.5，(1，2，4)，[ Hello" ，3]，'"Hello"] 

del1 删 除 元 素 方法 2: [5. 5，(1，2，4)，[ Hello’，3]，’Hello'] 


图 3-5 列表 增删 改 操作 结果 


3.4 ”集合 与 字典 


集合 和 字典 在 某 个 程度 上 是 非常 相似 的 ， 两 者 都 是 以 大 括号 来 进行 定义 ， 并 且 元 素 是 
无 序 排列 的 。 唯 一 区 别 在 于 元 素 格式 和 数据 类 型 有 所 不 同 ， 集 合 的 元 素 只 支持 数字 、 字 符 
串 和 元 组 ， 这 都 是 Python 不 可 变 的 数据 类 型 ， 而 字典 则 支持 Python 全 部 的 数据 类 型 。 我 们 
以 代码 的 形式 来 描述 集合 和 字典 : 


set 1 = {'Hello', 'Python', 123, (1， 'Love')} (集合 ) 
dicE T= nane python 3 A myliser Du 2 SI (字典 ) 


对 集合 与 字典 的 定义 进行 分 析 ， 集 合 的 元 素 只 有 数字 、 字 符 串 和 元 组 ， 如 果 集 合 元 素 
为 元 组 ， 并 且 元 组 里 面 嵌 套 列表 ， 程 序 也 会 提示 错误 信息 。 字 典 的 元 素 是 以 key:value 的 形 
式 表 示 ，key 和 value 可 以 是 任意 的 数据 类 型 ， 每 个 key 是 唯一 的 ， 不 能 重复 ， 而 value 则 
没有 限制 。 

在 实际 开发 中 ， 集 合 的 使 用 频率 相对 较 小 ， 其 主要 原因 是 元 素 无 序 排列 以 及 数据 类 型 
的 限制 要 求 等 多 方面 因素 ， 这 些 因 素 不 利于 集合 的 读 取 和 操作 。 而 字典 是 经 常 使 用 的 数据 
类 型 之 一 ， 并 且 与 JSON 的 结构 非常 相似 ， 本 节 将 会 深入 讲述 字典 的 使 用 方法 。 
的 使 用 也 就 是 对 字典 进行 增删 改 查 ， 这 里 通过 代码 的 形式 说 明 字典 具体 的 操作 方 
式 ， 代码 如 


# 定义 空 的 字典 

ict st 

# 添加 元 素 

cict 和 [ae python” 
print (' 添 加 字典 元 素 : '，dict 1) 
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## 修改 元 素 的 value 
dict l['name'] = 'I Love Python'" 
print (' 修 改 字 典 元 素 : '，dict 1) 


# 读 取 某 个 字典 元 素 

# 以 中 括号 方式 读 取 字 典 元 素 ， 如 果 字 典 不 存在 该 元 素 ， 则 提示 错误 信息 
name = dict 1l['name'] 

# 使 用 get 方法 读 取 字典 元 素 

# 如 果 字 典 不 存在 该 元 素 ， 则 将 字符 串 ' 不 存在 这 个 元 素 ' 赋 值 到 变量 age 
age = dict 1.get('age'， ' 不 存在 这 个 元 素 ') 

print (' 读 取 字 典 元 素 name 的 值 : '，name) 

print (' 读 取 字 典 元 素 age 的 值 : ' ，age) 


# 删除 字典 元 素 name 
del dict 1l['name'] 
print (' 删 除 字典 元 素 name: '，dict 1) 


# 清空 字典 所 有 元 素 
dict 1['"name'] = 'Python’ 


dict 1.clear() 
print (' 清 空 字典 所 有 元 素 : '，dict 1) 


# 删除 整个 字典 对 象 
del dict 1 


上 述 代 码 实 现 了 字典 的 增删 改 查 操作 ， 实 现 方式 与 列表 的 大 致 相同 。 在 PyCharm 中 


[etl 


行 代码 并 查看 运行 结果 ， 如 图 3-6 所 示 。 


添加 字典 元 素 : { name” : “Python } 
修改 字典 元 素 : 【name' : 'I Love Python'} 
读 取 字 典 元 素 name 的 值 : I Love Python 


读 取 字典 元 素 age 的 值 : 不 存在 这 个 元 素 
删除 字典 元 素 name : 人 
清空 字典 所 有 元 素 : 人 


图 3-6 字典 的 增删 改 查 输出 结果 
如 果 字 典 中 嵌 套 了 多 个 字典 或 列表 ， 可 以 从 字典 最 外 层 往 内 层 逐 步 定位 ， 定 位 方式 是 
E 


字典 元 素 的 key 实现 ， 通 过 这 样 的 定位 我 们 能 够 获取 目标 元 素 。 这 里 以 代码 的 方式 加 以 


说 明 ， 代 码 如 下 : 
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# 多 重 嵌 套 的 字典 读 取 方 式 
ie 
"avs. MHellor, 
区 于 
oe MEYERDmS 
adv Lmorldr. "hinarl 


} 
} 
# 读 取 键 为 c 的 值 
# 由 于 键 c 在 键 b 的 值 里 面 ， 因 此 先 读 取 键 b 的 值 ， 再 读 取 键 c 的 值 
oom ocean el 
get c = get bl['c'] 
# 读 取 列表 值 china 
# 由 于 列表 是 键 a 的 值 ， 因 此 先 读 取 键 b 的 值 ， 再 读 取 键 a 的 值 ， 最 后 读 取 列表 的 值 
get p= OIC 
get aa = get bl al 
get China = get_d[11] 


除 此 之 外 ，Python 的 字典 还 内 置 了 多 种 函数 与 方法 ， 具 体 说 明 如 下 : 


# 内 置 函数 

# 比较 两 个 字典 元 素 。 
cmp(dictl, dict2) 
# 计算 字典 元 素 的 总 数 。 
len(dict) 

# 将 字典 以 字符 串 表 示 。 
str(dict) 


# 内 置 方法 

# 返回 一 个 字典 的 浅 拷贝 

dict.copy() 

# 创建 一 个 新 字典 ， 将 列表 或 元 组 的 元 素 做 字典 的 key，value 是 每 个 key 的 值 
dict.fromkeys (list, value) 

# 如 果 键 在 字典 dict 里 ， 那 么 返回 true， 否 则 返回 false 
dict.has_key(key) 

# 以 列表 形式 返回 字典 的 键 值 对 ， 每 个 键 值 对 以 元 组 形式 表示 

dict.items () 

# 以 列表 返回 一 个 字典 所 有 的 键 

dict.keys () 

# 读 取 字 典 元 素 ， 但 如 果 键 不 存在 于 字典 中 ， 将 会 添加 键 并 将 值 设 为 default 
dict.setdefault (key, default=None) 
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# 把 字典 dict2 的 键 值 对 更 新 到 dict 里 
dict.update (dict2) 
# 以 列表 返回 字典 中 的 所 有 值 


dict.values () 


3.5 ”数据 类 型 的 转化 


数据 转换 是 每 种 编程 语言 的 一 个 基本 操作 ， 但 不 同 的 编程 语言 有 不 同 的 转换 规则 。 在 
Python 中， 不同 的 数据 类 型 都 能 相互 转换 ， 其 中 最 常见 的 是 字符 串 、 列 表 和 字典 的 相互 转换 。 


3.5.1 字符 串 和 列表 的 转换 


将 字符 串 转 换 成 列表 ， 可 以 由 字符 串 函 数 split 实现 ， 而 列表 转换 字符 串 可 以 使 用 join 
函数 实现 。 下 面 我 们 通过 代码 示例 进行 讲述 : 

# 字符 串 转换 列表 

str = Kello EyEbom, 

ist = LPL 

# 输出 : ['Hello'，'Python'] 

print (list 1) 


# 列表 转换 字符 串 
list 1 = ['Hello', 'Python'] 
Bta d= voin(iist 1 


# 输出 : Hello Python 
print (str 1) 


通过 上 述 字符 串 和 列表 的 相互 转换 ， 可 以 发 现 字 符 串 是 根据 字符 串 里 面 的 空格 进行 分 
段 截 取 ， 使 其 生成 多 个 子 字符 串 ， 然 后 将 多 个 子 字符 串 组 合成 一 个 列表 ; 而 列表 转换 字符 
串 是 将 列表 的 每 个 元 素 以 空格 进行 拼接 ， 使 其 生成 相应 的 字符 串 。 除 此 之 外 ， 对 于 一 些 特 
殊 的 字符 串 或 列表 可 以 使 用 其 他 方法 转换 ， 请 看 如 下 示例 : 

# 字符 串 转换 为 列表 

str 1 = '[1,2,"Hellon]'， 

# 字符 串 内 容 与 列表 的 数据 格式 相同 ， 可 以 使 用 eval 函数 将 字符 串 转换 成 列表 

list 1 ="eval(str 1) 

print ('eval 函数 : '，1list 1) 
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# 1ist 函数 是 将 字符 串 的 每 个 元 素 作为 列表 的 元 素 
| 
print ('1ist 函数 : '，1ist 2) 


# 列表 转换 字符 串 

# str 函数 直接 将 整个 列表 转换 为 字符 串 
list 1 = ["Hello'，"Python'] 
Ste ELSE Ly 

print ('str 函数 : '，str 1) 


上 述 代 码 主 要 讲述 函数 eval、str 和 1ist 的 使 用 ， 这 些 函 数 需要 符合 一 定 的 转换 要 求 才 能 
使 用 ， 在 使 用 这 些 函 数 之 前 ， 需 要 清楚 转换 要 求 以 及 转换 后 的 数据 格式 。 上 述 代 码 的 运行 
结果 如 图 3-7 所 示 。 


eval 函 数 : [1，2， "Hello' ] 
dl I 


str 函 数 : [’Hello’,，'Python’] 


图 3-7 字符 串 与 列表 的 转换 结果 


3.5.2 ”字符 串 与 字典 的 转换 


讲述 了 字符 串 与 列表 的 相互 转换 后 ， 接 下 来 讲述 字符 串 与 字典 的 相互 转换 。 由 于 字典 
是 以 键 值 对 的 形式 表示 ， 而 字符 串 是 以 文本 的 形式 表示 ， 两 者 的 表现 形式 存在 较 大 的 差 
异 ， 因 此 在 相互 转换 上 会 有 一 定 的 限制 。 字符 串 转换 为 字典 可 以 通过 dict 函数 实现 ， 而 字 
转换 为 字符 串 可 通过 valuesO) 函 数 来 获取 字典 的 所 有 值 ， 然 后 将 其 转换 成 字符 串 ， 具 体 示 
例如 下 : 

# 字符 串 转换 为 字典 

3 六 RelyO 

str 2 = "Python' 

dict 1 = dict(a=str 1, b=str 2) 

# 输出 : 字符 串 转换 字典 : {'a': 'Hello'，, 'b': 'Python'} 

print (" 字 符 串 转换 字典 : '，dict 1) 


# 字典 转换 为 字符 串 

dict 1 Ma "Hollo” "bs “python 
list 1 = dict 1.values'() 
SE 


42 


字典 
的 形 


| “Python 自动 化 开发 实战 


# 输出 : 字典 转换 字符 串 : Hello Python 
print (' 字 典 转换 字符 串 : '，str 1) 


当 字 符 串 转换 为 字典 时 ，dict 函数 需要 以 key=value 的 形式 作为 函数 参数 ， 该 参数 表示 
里 的 一 个 键 值 对 ， 当 字典 转换 为 字符 串 时 ， 由 values0 函 数 获取 字典 的 所 有 值 并 以 列表 
式 表 示 ， 再 将 列表 转化 成 字符 囊 ， 从 而 实现 字典 转换 为 字符 串 。 此 外 ， 还 可 以 将 特殊 


字符 


串 转换 字典 ， 代 码 示例 如 下 : 


# 特殊 字符 串 转换 字典 

# 方法 一 : eval 函数 实现 

Sterol = "Ta Helo Mor "Pythonnp, 
dict 1 = evall(str 1) 

Pee( rc 


# 方法 二 : json 模块 的 1oads 函数 

# 局 限 性 : 如 果 字 符 串 里 的 字典 键 值 对 是 使 用 单 引 号 表示 ， 则 该 方法 无 法 转换 ， 
# 如 将 str_1 改 为 "'{'a': "Hello'，"b': 'Python'}" 

import json 

dict 2 = json.loads (str 1) 

print( qcEl2) 


# 方法 三 :ast 模块 的 1iteral_eval 函数 
import ast 

dict 3 = ast.literal evall(str 1) 
(cE) 


如 果 字 符 串 的 内 容 与 字典 的 数据 格式 非常 相似 ， 可 以 使 用 上 述 三 种 方法 将 字符 串 转换 


。 三 者 的 输出 结果 都 是 相同 的 ， 如 图 3-8 所 示 。 


1o'"，"b" : ’Python’} 
lo', 'b’: ’Python’} 


lo’, 'b’: 'Python’} 


图 3-8 字符 串 转换 或 字典 


3.5.3 ”列表 与 字典 的 转换 


表 的 
成 列 


本 节 我 们 讲述 列表 与 字典 的 相互 转换 。 列 表 转 换 成 字典 可 以 使 用 dict 函数 实现 ， 但 列 
元 素 必须 以 一 个 列表 或 元 组 表示 ， 以 列表 或 元 组 的 形式 代表 字典 的 键 值 对 ;字典 转换 
表 有 三 种 方式 ， 分 别 由 values0、keys0 和 items0 函 数 实现 。 有 具体 代码 示例 如 下 : 


列表 转换 为 字典 
SEO 

list 2 = ['b', "Python'"] 

Gree Tac eel rs 2) 
print (' 列表 转换 字典 : '，dict 1) 


# 字典 转换 列表 

ducEat = Ma ollon se "be "python 
# 获取 字典 的 所 有 值 并 生成 列表 

list 1 = dict 1.values() 
print('values () 函 数 : '， isEaE LD 
# 获取 字典 的 所 有 键 并 生成 列表 

list 2 = dict 1.keys() 

print ('keys() 函数 : '，1ist (list 2)) 
# 获取 字典 的 所 有 键 值 并 生成 列表 

list 3 = dict 1.items() 

print ('items () 函数 : '，1ist (list 3)) 


当 列 表 转 换 成 字典 时 ， 列 表 list_ 1 和 list_2 将 会 作为 字典 的 键 值 对 ， 在 dict 函数 中 ， 列 
表 list_1 和 list_ 2 作为 一 个 新 列表 的 元 素 ， 这 样 就 能 实现 列表 转换 成 字典 ， 当 执行 字典 转换 
为 列表 时 ， 函 数 values0、keys0 和 items0 会 生成 一 个 非 列表 对 象 ， 因 此 还 需要 对 其 使 用 list 
函数 转换 成 列表 。 运 行 结果 如 图 3-9 所 示 。 


列表 转换 字典 : {a’: 'Hello’, ’b’: 'Python’} 
values () 函数 : [ Hello" ， "Python'] 


keys () 函数 ， [Da"，"b'] 
items () 函数 : [('a’,，’Hello’), ('b’, "Python')] 


图 3-9 列表 与 字典 的 转换 结果 


3.6 ”本 章 小 结 


数据 类 型 是 任何 一 门 编程 语言 的 组 成 部 分 ， 学 习 编 程 语言 必须 要 学 习 其 数据 类 型 。 
Python 的 标准 数据 类 型 主要 有 数字 、 字 符 串 、 列 表 、 元 组 、 集 合 和 字典 。 按 照 数据 存储 的 
内 存 地 址 可 变性 分 为 不 可 变数 据 和 可 变数 据 ， 可 变数 据 有 列表 、 集 合 和 字典 ; 不 可 变数 据 
有 数字 、 字 符 串 和 元 组 。 
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数字 可 以 分 为 几 个 类 型 : 整 型 、 浮 点 型 、 布 尔 型 和 复数 ， 具 体 说 明 如 下 : 


(1) 整 型 是 没有 小 数 点 的 数值 。 

(2) 浮 点 型 是 带 有 小 数 点 的 数值 。 

(3) 布尔 型 以 True 和 False 表示 ， 实 质 分 别 为 1 和 0， 为 区 分 整 型 的 1 和 0， 而 改 为 
True 和 False。 

(4) 复数 是 由 一 个 实数 和 一 个 虚数 组 合 构成 ， 可 以 用 x+yj 或 者 complex(x,y) 表 示 。 


字符 串 〈String) 是 由 数字 、 字 母 、 下 划 线 组 成 的 一 串 字 符 ， 可 以 用 单 引号 、 双 引号 或 
三 引号 来 表示 。 常 用 的 字符 串 操作 有 截取 、 蔡 换 、 查 找 、 分 割 和 拼接 。 


(1) 字符 串 截 取 ， 截 取 格式 为 : 字符 串 [开始 位 置 :结束 位 置 :间隔 位 置 ]。 

(2) 字符 串 蔡 换 ， 蔡 换 方法 为 : 字符 串 .replace(' 被 蔡 换 内 容 " "替换 后 内 容 )。 

(3) 字符 串 查 找 元 素 ， 查 找 方法 为 :字符 串 .find(' 要 查找 的 内 容 ' [, 开始 位 置 ,结束 
位 置 ])。 

(4) 字符 串 分 割 ， 分 割 方法 为 : 字符 串 .split(' 分 割 符 ', 分 割 次 数 )。 

(5) 字符 串 拼 接 方式 : 使 用 加 号 拼接 、 使 用 逗号 拼接 、 直 接 拼接 、 格 式 化 拼接 和 join 
方法 拼接 。 


元 组 是 使 用 小 括号 来 定义 ， 而 列表 是 使 用 中 括号 来 定义 。 元 组 列表 里 面 的 元 素 可 以 是 
任意 的 数据 类 型 ， 每 个 元 素 之 间 使 用 英文 逗号 隔 开 ， 如 果 元 组 和 列表 中 没有 元 素 ， 说 明 这 
是 一 个 空 的 元 组 或 列表 。 

元 组 或 列表 的 元 素 的 数据 类 型 可 以 是 整 型 、 字 符 串 、 布 尔 型 、 浮 点 型 、 元 组 和 列表 。 如 
果 元 素 是 一 个 元 组 或 列表 ， 那 么 这 是 一 种 找 套 模式 ， 这 种 模式 在 日 常 的 开发 中 是 很 常见 的 。 

集合 和 字典 在 某 个 程度 上 是 非常 相似 的 ， 两 者 都 是 以 大 括号 来 进行 定义 ， 并 且 元 素 是 
无 序 排列 的 。 唯 一 区 别 在 于 元 素 格式 和 数据 类 型 有 所 不 同 ， 集 合 的 元 素 只 支持 数字 、 字 符 
串 和 元 组 ， 这 都 是 Python 里 面 不 可 变 的 数据 类 型 ， 而 字典 是 支持 Python 全 部 的 数据 类 型 。 

数据 类 型 的 相互 转换 主要 讲述 了 字符 串 与 列表 、 字 符 串 与 字典 、 列 表 与 字典 的 相互 转 
换 ， 不 同 的 数据 类 型 有 不 同 的 转换 规则 ， 转 换 规则 是 多 变 的 ， 可 以 根据 实际 情况 选择 合适 
的 转换 方法 。 


流程 控制 语句 


本 章 讲述 Python 的 流程 控制 语句 ， 包 括 : 条 件 判 断 语句 、 循 环 语句 、 推 导 式 和 三 目 运 
算 符 。 条 件 判断 语句 和 循环 语句 是 基本 的 流程 控制 语句 ， 推 导 式 和 三 目 运 算 符 是 在 循环 语 
名 和 条 件 判断 语句 的 基础 上 扩展 而 成 ， 牢 固 掌握 这 些 基 础 编程 语法 ， 可 以 编写 出 更 具 灵 活 
性 的 应 用 程序 。 


4.1 j 半 语句 


人 们 常 说 人 生 就 是 一 个 不 断 做 选择 题 的 过 程 有 的 人 没 得 选 ， 只 有 一 条 路 能 走 ， 有 的 
人 好 一 点 ， 可 以 二 选 一 ， 有 些 能 力 好 或 者 家 境 好 的 人 ， 可 以 有 更 多 的 选择 ， 还 有 一 些 人 在 
人 生 的 迷茫 期 不 停 地 在 原 地 打转 ， 找 不 到 方向 。 程 序 好 比 人 生 ， 而 我 们 可 以 对 程序 进行 控 
制 ， 让 它 根据 条 件 的 不 同 而 选择 不 同 的 执行 过 程 。 

Python 的 条 件 控制 由 站 语句 执行 ， 根 据 执行 结果 的 True 或 False 来 执行 相应 的 代码 块 。 
如 图 4-1 所 示 是 条 件 语句 的 执行 过 程 。 

从 图 中 可 以 大 致 了 解 计 语句 有 具体 的 执行 过 程 ， 简 单 来 说 ，if 语句 是 通过 判断 菜 个 变量 
值 是 否 符合 条 件 ， 如 果 符 合 就 执行 相应 的 代码 块 ， 如 果 不 符合 就 执行 另 一 个 代码 块 。 
Python 中 最 简单 的 让 语句 如 下 所 示 : 
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number = 工 
if number == 1: 

print ('Hello Python') 
else: 

print('Hello World') 


代码 块 


图 4-1 让 语句 流程 图 


上 述 代码 根据 变量 number 的 数值 进行 判断 ， 如 果 变 量 number 的 数值 为 1， 程 序 输出 
“Hello Python”， 否 则 输出 “Hello World”。 例 子 中 的 变量 number 只 是 执行 了 一 次 条 件 判 
断 ， 如 果 想 对 变量 进行 多 次 判断 ， 可 以 在 上 述 代 码 中 添加 elif 语句 ， 具 体 示例 如 下 : 


number = 1 
if number == 1: 
print('Hello Python') 
elif number == 2: 
print ('Hello World') 
elif number == 3: 
print('Hello China') 
elses 
print('Hello Hello') 


在 上 述 例子 中 ， 我 们 对 变量 number 设置 了 三 次 判断 ， 判 断 的 顺序 从 上 至 下 依次 执行 ， 
具体 判断 说 明 如 下 : 


(1) 首先 判断 变量 number 是 否 等 于 1， 如 果 符 合 判 断 ， 则 输出 “Hello Python” 并 终 
止 整 个 站 语句 ， 否 则 执行 下 一 个 条 件 判断 。 


/ 
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(2) 第 二 个 判断 是 判断 变量 number 是 否 等 于 2， 如 果 符 合 判 断 ， 则 输出 “Hello World” 


并 终止 整个 让 语句 ， 否 则 执行 下 一 个 条 件 判 断 。 


(3) 最 后 判断 变量 number 是 否 等 于 3， 如 果 符 合 判断 ， 则 输出 “Hello China” 并 终止 


整个 站 语 句 ， 否 则 程序 会 输出 “Hello Hello”。 


上 述 代 码 中 ， 我 们 只 需 修改 变量 number 的 值 ， 程 序 运行 时 就 会 根据 变量 值 的 不 同 而 输 


面 我 们 以 代码 示例 讲述 如 何 实现 站 嵌 套 : 


number = 1 
bool = True 
if number == 1: 


# if 民 套 

if bool == True : 
print('Hello Python') 

else: 


print('I Love Python') 
elses 
print('Hello Hello') 


出 不 同 的 结果 。 如 果 让 语句 中 的 代码 块 包含 另外 一 个 迁 语 句 ， 这 种 情况 称 为 让 嵌 套 。 矢 套 
是 编程 语言 里 比较 常见 的 代码 结构 ， 比 如 字典 嵌 套 、 列 表 典 套 、 鞍 嵌 套 和 循环 嵌 套 等 。 下 


在 代码 中 添加 变量 bool， 程 序 首先 判断 变量 number 是 否 为 1， 如 果 符 合 条 件 ， 再 对 变 
量 bool 进行 判断 ， 如 果 变 量 bool 为 True， 则 输出 “Hello Python”， 否 则 输出 “I Love 
Python”。 需 要 注意 的 是 ， 在 编写 if 语句 时 ， 每 个 条 件 的 后 面 必 须 添加 英文 冒号 且 相 应 的 


代码 块 需 使 用 缩 进 符 来 划分 。 


4.2 for 循环 


循环 是 指 程序 中 需要 重复 执行 的 代码 ，Python 的 循环 结构 有 for 循环 和 while 循环 。for 
循环 是 一 种 友 代 循环 机 制 ， 迭 代 即 重复 相同 的 罗 辑 操作 ， 每 次 操作 都 是 基于 上 一 次 结果 而 


进行 的 。Python 的 for 循 环 可 以 遍历 任何 序列 的 对 象 ， 如 字符 串 、 元 组 列表 和 字典 等 ， 
法 如 下 : 
for iterating in sequence: 


print (iterating) 


其 语 
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根据 for 循环 的 语法 ， 我 们 使 用 流程 图 进一步 了 解 for 循环 的 执行 过 程 ， 如 图 4-2 所 示 。 


图 4-2 for 循环 流程 图 


从 图 中 可 以 知道 ， 循 环 体 是 一 个 可 夫 代 的 对 象 ， 常 用 的 迭代 对 象 有 字符 串 、 列 表 、 字 


和 range 对 象 。 我 们 通过 代码 对 这 些 迭 代 对 象 实现 for 循环 遍历 ， 具 体 代码 如 下 : 


# 循环 字符 串 
str 1 = ' 我 正在 学 Python' 
result = [] 
For dd Anestr Ls 

result .append (i) 
print (result) 


# 循环 列表 
list 1 = [' 我 '，' 正 '，' 在 '，' 学 '，'Python'] 
result = [] 
for a Aan Uist Ts 
result .append (i) 
print (result) 


# 循环 字典 


niecEET = ey RR ev TE eva EVA 


result = [] 
For i Ln dlet Ts 
result .append (i) 


print (result) 


# 循环 rang 对 象 ，range (10) 会 生成 0-9 的 范围 值 


range 1 = range(10) 


"Python' } 
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result = [] 

for i in range 1: 
result .append (i) 

print (result) 


在 上 述 4 个 例子 中 ， 对 于 字符 串 、 列 表 和 字典 的 遍历 循环 是 相对 容易 理解 ，range 对 象 
是 for 循环 中 经 常 使 用 的 循环 对 象 ， 同 时 也 说 明 for 循环 是 支持 对 象 的 遍历 ， 对 象 是 由 类 入 
例 化 生成 的 ， 有 关 类 的 知识 会 在 第 6 章 讲 述 。 代 码 运行 结果 如 图 4-3 所 示 。 
FF 我 “正和 "在 学 "Python 了 
[' keyl’, ’key2’, ’key3’, 'key4’] 


[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 


图 4-3 for 循环 的 运行 结果 


在 for 循环 中 ， 我 们 还 可 以 嵌 套 for 循环 和 让 语句 。 这 两 种 柑 套 方式 是 实际 开发 中 最 为 
常见 的 ， 具 体 的 代码 示例 如 下 : 


# if 语句 嵌 套 
rosuLt LE = 
result 2 = [] 
for i in range(10): 
if i % 2 == 0: 
result 1.append (i) 


alses 
result 2.append(i) 
print (' 能 被 2 整除 的 数 有 : '，result 1) 
print (' 不 能 被 2 整除 的 数 有 : '，result 2) 


# 循环 堪 套 
for i in range(5): 
SEr 
for j in range(3) : 
9 交 学 
print (' 第 '，i+1,，' 行 的 数据 是 '，str_1) 


for 循环 中 嵌 套 站 语句 通常 是 对 循环 体 进行 一 个 判断 筛选 ， 根 据 当 前 循环 值 的 不 同 而 执 
行 不 同 的 处 理 ， 如 上 述 例 子 中 ， 嵌 套 站 语句 是 将 0 到 9 之 间 的 范围 值 进行 分 类 筛选 。 如 果 
for 循环 是 嵌 套 for 循环 ， 可 将 运行 结果 看 作 一 张 二 维 表格 ， 最 外 层 的 循环 就 如 表格 的 行 
数 ， 符 套 里 面 的 循环 是 表格 的 列 数 。 上 述 代码 的 运行 结果 如 图 4-4 所 示 。 
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能 被 2 整除 的 数 有 : [0，2，4,6，8] 
不 能 被 2 整除 的 数 有 : [1，3，5， 

第 1 行 的 数据 是 0， ; 

第 2 行 的 数据 是 1， 
第 
第 
第 


行 的 数据 是 2， 
行 的 数据 是 3， 
行 的 数据 是 4， 


图 4-4 带 媒 套 的 for 循环 的 运行 结果 


4.3 ”while 循环 


从 上 一 节 我 们 知道 ，Python 的 循环 结构 有 for 循环 和 while 循环 ，while 循环 是 根据 条 
件 的 判断 结果 而 决定 是 否 执行 循环 。 只 要 条 件 判 断 结 果 为 True， 程 序 就 会 执行 循环 ， 直 至 
条 件 判 断 结 果 为 False， 有 具体 语法 如 下 : 


while condition: 
print (iterating) 
根据 while 循环 的 语法 ， 我 们 使 用 流程 图 进一步 了 解 while 循环 的 执行 过 程 ， 如 图 4-5 
所 示 。 


判断 条 件 
判断 结果 为 False 


判断 结果 为 True 


图 4-5 while 循环 流程 图 


从 图 中 发 现 ，while 循环 和 for 循环 的 执行 过 程 是 大 致 相同 的 ， 只 不 过 两 者 的 循环 条 件 
判断 方式 有 所 不 同 。 在 一 些 特定 的 情况 下 ， 不 同 的 循环 方式 决定 了 代码 质量 的 高 低 。 通 过 
以 下 例子 来 讲述 如 何 使 用 while 循环 ， 代 码 如 下 : 


bool = True 
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while bool == True: 
print('Hello Python') 
bool = False 


上 述 代码 只 执行 一 次 循环 ， 因 为 在 循环 里 设置 了 变量 bool 的 值 为 False， 当 第 二 次 循环 
开始 之 前 ， 由 于 条 件 判断 结果 为 False， 使 得 第 二 次 循环 被 终止 ， 从 而 终止 了 整个 while 循 
环 。 除 此 之 外 ，while 循环 也 支持 迁 语 句 嵌 套 和 循环 嵌 套 ， 有 具体 的 实现 方式 与 for 循环 是 相 
同 的 ， 此 处 不 再 详细 讲述 。 

在 循环 过 程 中 ， 如 果 想 终止 整个 循环 或 者 直接 跳 过 当前 循环 的 剩余 语句 而 执行 下 一 轮 


循环 ， 可 以 分 别 使 


break 语句 和 continue 语句 。 这 两 个 语句 只 能 在 循环 是 


且 面 使 用 ， 如 果 在 


循环 外 使 用 ， 程 序 会 提示 错误 信息 。 以 下 面 的 例子 来 讲述 如 何在 for 循环 和 while 循环 中 使 


break 语句 和 continue 语句 ， 代 码 如 下 : 


# for 循环 的 break 
# 当 i=5 的 时 候 ， 终 止 整个 for 循环 


result = [] 


for i in range(10): 


:人 
break 
ES 


result .append (i) 
print ('for 循环 的 break: '，result) 


# for 循环 的 continue 
# 当 i=5 的 时 候 ， 跳 出 当前 循环 并 执行 下 一 轮 循环 


result = [] 


for i in range(10): 


Ss 


continue 


result .append (i) 


print ('for 循环 的 continue: '，result) 


# while 循环 的 break 


result = [] 
i=0 


while i < 10: 


让 三 有 


break 
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result .append (i) 
i+=1 


print ('while 循环 的 break: '，result) 


# while 循环 的 continue 
result = [] 


i=0 
while i < 10: 
if i == 5: 
i+=1 
continue 


result .append (i) 
4 


print ('while 循环 的 continue: '，result) 

两 个 循环 方式 分 别 使 用 break 语句 和 continue 语句 ， 而 且 实现 的 功能 是 非常 相似 的 ， 这 
样 可 以 深入 了 解 两 个 语句 对 不 同 的 循环 方式 所 造成 的 差异 。 运 行 上 述 代 码 ， 结 合 运行 结果 
分 析 两 者 的 差异 ， 运 行 结果 如 图 4-6 所 示 。 


for 循 环 的 break: [0， 
for 循 环 的 continue: 


while 循 环 的 break: 


图 4-6 break 和 continue 的 执行 结果 


从 运行 结果 可 以 看 出 ，for 循 环 和 while 循环 都 分 别 循环 10 次 。 当 变量 i 等 于 5 的 时 候 ， 
break 语句 会 将 整个 循环 终止 ， 所 以 列表 的 元 素 值 只 有 0 到 4; 而 continue 语句 将 当前 的 循 
环 跳出 ， 继 续 执行 下 一 轮 的 循环 ， 所 以 列表 的 元 素 值 从 0 到 9 并 且 不 含 5。 


4.4 推导 式 


推导 式 又 称 解 析 式 ， 这 是 Python 一 种 独 有 的 特性 。 推 导 式 是 可 以 从 一 个 数据 序列 构建 
男 一 个 新 的 数据 序列 的 结构 体 ， 数 据 序列 是 我 们 常 说 的 可 循环 对 象 ， 如 字符 串 、 列 表 、 字 
和 range 对 象 等 。 推 导 式 主要 有 列表 推导 式 、 集 合 推导 式 和 字典 推导 式 ， 不 管 哪 种 类 型 
罗 推 导 式 ， 其 使 用 方法 都 是 相似 的 ， 下 面 以 代码 的 形式 加 以 说 明 : 


# 列表 推导 式 
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result = [x for x in range(5)] 


print (result) 
Ci do 2 


# 集合 推导 式 


result = {x for x in range(5)} 


print (result) 
析出 :0 37 A 


# 字典 推导 式 


result = {x: x for x in range(5)} 


print (result) 
输出 E00OEON 2 2 


3 


sa 


代码 中 分 别 列举 了 列表 推导 式 、 集 合 推 导 式 和 字典 推导 式 ， 发 现 推导 式 的 语法 是 相对 固 
定 的 。 推 导 式 是 通过 循环 数据 序列 的 每 个 元 素 ， 然 后 将 每 个 元 素 组 合成 新 的 数据 序列 。 如 果 
想 对 当前 元 素 进行 一 个 简单 的 判断 ， 可 以 在 循环 后 面 添加 站 语句 ， 具 体 实现 方式 如 下 : 


# 列表 推导 式 


result = [x for x in range(10) if x > 5] 


print (result) 


# 输出 : [6，7，8，9] 
# 集合 推导 式 


result = {x for x in range(10) if x > 5} 


print (result) 
# 输出 : 18，9，6，7) 


# 字典 推导 式 


result = {x: x for x in range(10) if x > 5} 


print (result) 

# 输出 : {6: 6, 7: 7，8: 8， 

在 推导 式 中 只 能 添加 站 判断 ， 
和 else 等 分 支 判断 都 是 不 允许 的 。 


> 


9} 


且 不 允许 设置 多 个 条 件 判断 ， 比 如 在 推导 式 设置 elif 
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Python 的 三 元 表达 式 也 可 以 称 为 三 目 运算 符 ， 在 语法 上 ， 它 与 其 他 编程 语言 的 三 目 运 
算 符 有 所 不 同 。 简 单 地 理解 ，Python 的 三 目 运算 符 是 于 语句 的 简化 使 用 。 通 过 以 下 示例 读 
者 可 理解 Python 的 三 目 运算 符 : 


number = 10 
result = 'Hello Python' if number >= 10 else 'Hello World' 
print (result) 


# 上 述 代码 等 价 于 
number = 10 
if number >= 10: 

result = "Hello Python'" 
Slsers 

result = "Hello World' 
print (result) 


从 上 述 例 子 可 以 看 到 ， 三 目 运 算 符 是 将 一 个 简单 的 让 语句 用 一 行 代码 表示 ， 这 样 可 以 
精简 代码 量 ， 提 高 代码 质量 。 如 果 涉 及 到 循环 嵌 套 和 if 嵌 套 ， 三 目 运 算 符 也 同样 适用 ， 具 
体 的 实现 方式 如 下 : 

# 三 目 运算 符 的 if 语句 嵌 套 

number = 10 

result = 'Python' if number < 5 else ('World' if number ==5 else 'China') 


print (result) 
# 输出 : china 


# 三 目 运算 符 的 循环 霸 套 

number = 10 

result = [x for x in range(10)] if number > 10 else {x for x in range(10)} 
print (result) 

x 2 a Bn Td gy 


虽然 三 目 运 算 符 可 以 实现 循环 嵌 套 和 让 嵌 套 ,但 是 相 比 过 语句 、for 循环 和 while 循环 
来 说 ， 它 的 语句 柑 套 还 是 存在 一 定 的 局 限 性 ， 无 法 适应 多 变 的 需求 开发 。 
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.6 ”实战 : 编写 “ 猜 数 字 ” 游 戏 


Python 实现 猜 数 字 游戏 可 由 站 语句 和 循环 语句 实现 。 游 戏 的 大 致 规 则 如 下 : 


(1) 程序 随机 生成 一 个 数字 ， 随 机 生成 的 数字 必须 在 限定 的 数值 区 间 内 ， 比 如 0 一 
100、20 一 80 等 。 
(2) 用 户 通过 输入 一 个 数值 ， 程 序 将 两 个 数值 进行 对 比 ， 根 据 对 比 结果 输出 相应 的 


提示 。 


(3) 如 果 输 入 的 数值 比 生成 的 数值 大 ， 程 序 就 输出 提示 “大 了 ”， 并 重新 提示 用 户 输 
入 数值 。 

(4) 如 果 输 入 的 数值 比 生成 的 数值 小 ， 程 序 就 输出 提示 “小 了 ”， 并 重新 提示 用 户 输 
入 数值 。 

(5) 如 果 输 入 的 数值 等 于 生成 的 数值 ， 程 序 就 输出 提示 “ 猜 对 了 ”， 并 终止 程序 。 


我 们 根据 游戏 规则 落实 游戏 实现 过 程 ， 具 体 的 实现 过 程 大 致 如 下 : 


(1) 首先 在 一 个 可 控 范 围 内 生成 一 个 随机 数值 ， 并 将 数值 赋予 变量 number。 

(2) 程序 需要 给 用 户 提供 输入 口 ， 接 收 用 户 输入 的 数值 ， 并 赋值 给 变量 getNum， 
于 与 变量 number 进行 对 比 。 

(3) 变 量 getNum 和 number 的 大 小 进行 对 比 ， 对 比方 式 分 别 有 大 于 、 小 于 和 等 于 ， 不 
同 的 对 比 结果 执行 不 同 的 处 理 。 

(4) 根据 对 比 结果 ， 如 果 两 个 变量 相等 ， 则 终止 整个 程序 ， 否 则 重复 执行 步骤 2、 
3、4。 


从 上 述 的 实现 过 程 中 可 以 发 现 ， 程 序 的 实现 涉及 到 随机 数 的 生成 、 用 户 输入 提示 、 循 
环 和 让 语句 。 随 机 数 的 生成 可 以 使 用 Python 标准 库 random 实现 ; 用 户 输入 提示 由 Python 
的 内 置 函数 input 实现 ， 循 环 语句 使 用 while 循环 。 有 具体 的 代码 如 下 : 


# 导入 标准 库 random， 实 现 随 机 数 的 生成 
import random 
number = random.randint (0, 20) 
while 1: 
# 内 置 input 函数 用 于 给 用 户 提供 数值 的 输入 。 
# 由 于 input 函数 是 生成 字符 串 ， 所 以 需要 将 字符 串 转换 成 数字 。 
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getNum = int (input ( "请 输入 你 的 数字 : ") ) 
# 判断 输入 值 和 随机 数 的 大 小 
if getNum == number: 
# 判断 成 功 就 终止 整个 while 循环 

print (' 茹 喜 你 ， 你 猜 对 了 ') 

break 
elif getNum > number: 

Print (' 你 的 数字 比 结果 大 了 ') 
else: 


print (' 你 的 数字 比 结果 小 了 ' ) 


运行 上 述 代码 ， 程 序 首先 会 自动 生成 一 个 随机 数 ， 然 后 提示 用 户 输入 数据 。 当 用 


户 输 


入 数据 后 会 将 数据 与 随机 数 进行 对 比 ， 如 果 两 个 数值 是 大 于 或 小 于 ， 程 序 都 会 提示 相应 的 
结果 并 再 提示 用 户 再 次 输入 数值 ， 只 有 两 个 数值 相等 的 时 候 ， 程 序 才 会 终止 while 循环 。 


运行 结果 如 图 4-7 所 示 。 


请 输入 你 的 数字 : 70 
你 的 数字 比 结果 小 了 
请 输入 你 的 数字 : 9 
你 的 数字 比 结果 小 了 


请 输入 你 的 数字 : 72 
你 的 数字 比 结果 小 了 
请 输入 你 的 数字 : 73 
恭喜 你 ， 你 猜 对 了 


图 4-7 ” 猜 数 字 游戏 结果 


4.7 本章 小 结 


本 章 主要 讲述 了 让 语句 、for 循环 和 while 循环 的 原理 和 使 用 ， 推 导 式 是 for 循环 的 一 


个 特殊 使 用 ， 而 三 目 运算 符 是 让 语句 的 一 个 特殊 使 用 。 


让 语句 是 通过 判断 某 个 变量 值 是 否 符合 条 件 ， 如 果 符 合 就 执行 相应 的 代码 块 ， 如 果 不 


符合 就 执行 另 一 个 代码 块 ， 而 代码 块 里 面 可 以 嵌 套 迁 语 句 和 循环 语句 。 
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Python 的 循环 结构 有 for 循 环 和 while 循环 。for 循环 是 一 种 迭代 循环 机 制 ， 迭 代 即 重复 


相同 的 逻辑 操作 ， 每 次 操作 都 是 基于 上 一 次 结果 而 进行 的 。while 循环 是 根据 条 件 的 判断 结 


果 


1 


决定 是 否 执 行 循环 ， 只 要 条 件 判断 结果 为 True， 程 序 就 会 执行 循环 ， 直 至 条 件 判 断 结 


果 为 False 才 会 终止 整个 循环 。 


break 语句 和 continue 语句 使 用 在 循环 语句 里 ， 前 者 是 终止 整个 循环 ， 而 后 者 是 直接 跳 


过 当前 循环 的 剩余 语句 而 执行 下 一 轮 循环 。 


推导 式 又 称 解 析 式 ， 这 是 Python 一 种 独 有 的 特性 。 推 导 式 是 可 以 从 一 个 数据 序列 构建 


另 一 个 新 的 数据 序列 的 结构 体 ， 数 据 序列 是 我 们 常 说 的 可 循环 对 象 ， 如 字符 串 、 列 表 、 字 
典 和 range 对 象 等 。 


Python 的 三 元 表达 式 也 可 以 称 为 三 目 运算 符 ， 在 语法 上 ， 它 与 其 他 编程 语言 的 三 目 运 


算 符 有 所 不 同 。 简 单 地 理解 ，Python 的 三 目 运 算 符 是 站 语句 的 简化 使 用 。 


本 章 讲述 Python 的 函数 ， 包 括 : 函数 定义 、 函 数 参 数 、 函 数 返 回 值 、 函 数 调用 以 及 变 
量 的 作用 域 。 函 数 定义 是 声明 函数 ， 函 数 参数 是 函数 的 输入 ; 函数 返回 值 是 函数 的 输出 ; 
变量 的 作用 域 是 变量 在 函数 内 外 的 差异 。 


5.1 函数 的 定义 


函数 是 指 一 段 实 现 某 些 功 能 的 代码 块 ， 也 叫做 子 程序 或 方法 。 在 一 个 程序 里 面 ， 如 果 
重复 使 用 某 一 个 功能 ， 可 以 将 该 功能 的 代码 定义 成 一 个 函数 。 当 再 次 使 用 的 时 候 ， 只 需 直 
接 调 用 该 函数 即 可 ， 这 样 可 以 减少 代码 的 元 余 。 
Python 的 函数 以 关键 词 def 开头 ， 关 键 词 后 是 自 定 义 的 函数 名 ， 函 数 名 后 面 添加 英文 
格式 的 小 括号 ， 而 小 括号 里 面 可 以 根据 情况 来 决定 是 否 设置 函数 参数 。 对 于 自 定义 的 函数 
名 ， 建 议 遵循 驼峰 命名 法 的 命名 规则 。 驼 峰 命名 法 是 对 函数 名 中 的 每 一 个 逻辑 断 点 使 用 大 
写字 母 或 下 划 线 来 标记 ， 使 得 自己 的 代码 能 更 容易 地 在 同行 之 间 交 流 。 下 面 通过 代码 示例 
说 明 函 数 的 定义 及 驼峰 命名 法 : 
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# 函数 名 getName 和 get name 都 是 遵循 驼峰 命名 法 
# 函数 getName 设置 函数 参数 name， 并 在 函数 代码 中 使 用 参数 
def get name () : 


print('my name is Lili') 


def getName (name): 
print('my name is ', name) 


从 上 述 的 例子 中 可 以 看 到 ， 函 数 可 以 有 参数 ， 也 可 以 无 参数 。 如 果 函 数 带 有 参数 ， 参 
数 的 数据 格式 可 以 是 任意 的 ， 如 字符 串 、 数 字 、 元 组 、 列 表 、 字 典 或 对 象 均 可 作为 函数 参 
数 。 若 一 个 函数 有 多 个 参数 ， 每 个 参数 之 间 使 用 英文 的 去 号 隔 开 。 我 们 总 结 出 函数 的 定义 
语法 : 
def 函数 名 (参数 1， 参 数 2， 参 数 3) : 
函数 体 


函数 关键 词 def 和 函数 体 必须 以 缩 进 符 进行 划分 ， 缩 进 在 关键 词 def 的 代码 都 是 属于 函 
数 体 。 读 者 在 定义 函数 的 时 候 需 要 谨 记 缩 进 符 的 使 用 方式 。 

有 时 候 函 数 在 执行 某 些 处 理 时 ， 如 果 想 要 得 到 函数 的 处 理 结果 ， 可 通过 retum 将 结果 
返回 。retum 是 Python 的 内 置 函 数 ， 在 自 定义 函数 的 函数 体 中 使 用 retum 函数 可 以 将 所 需要 
的 数据 或 对 象 返回 到 函数 外 的 程序 。 有 关 函 数 返 回 值 的 使 用 ， 会 在 第 5.3 节 中 详细 讲述 。 

综 上 ， 一 个 完整 的 函数 定义 主要 有 : 关键 词 def、 函 数 名 和 小 括号 、 函 数 参 数 、 函 数 
体 、 返 回 值 。 其 中 函数 参数 和 返回 值 是 可 选 的 ， 具 体 由 函数 所 实现 的 功能 而 定 。 


5.2 ”函数 参数 


我 们 知道 ， 函 数 是 将 程序 的 某 部 分 功能 进行 封装 ， 因 此 函数 与 函数 外 的 程序 之 间 是 紧 
密 相连 的 ， 若 两 者 之 间 需 要 数据 传递 ， 可 以 通过 函数 参数 和 函数 返回 值 来 实现 。 函 数 参数 
是 由 函数 外 的 数据 传递 到 函数 里 ， 在 函数 里 可 对 参数 进行 读 写 操作 。 

函数 参数 对 于 函数 来 说 ， 并 非 必要 的 ， 如 果 函 数 无 需 使 用 参数 ， 则 在 定义 函数 的 时 候 无 
需 设 置 参数 ， 如 果 函 数 需要 使 用 参数 ， 则 可 以 根据 实际 情况 进行 定义 。 函 数 参 数 的 定义 语法 
如 下 : 


def myFunction(argl, arg2, *args, **kargs): 


函数 体 
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在 函数 参数 的 定义 语法 中 ， 分 别 定义 了 4 个 参数 arg1、arg2、*#args 和 **kargs， 参 数 具 
体 说 明 如 下 : 

(1) argl 和 arg2 是 开发 者 自 定义 的 参数 名 。 在 函数 里 ， 参 数 名 可 以 当成 变量 使 用 。 

(2) *args 是 将 多 个 参数 生成 一 个 列表 。 在 函数 里 ， 可 以 将 args 当成 一 个 列表 来 使 
里 面 的 参数 。 


(3) **kargs 将 多 个 参数 以 字典 的 形式 表示 。 在 函数 里 ， 通 过 字典 的 读 取 方 式 获取 


kargs 里 的 参数 。 


按照 参数 的 类 型 划分 ， 主 要 分 为 三 种 类 型 ， 自 定义 参数 argl1 或 arg2、*args 和 ##kargs， 


三 者 的 使 用 方法 如 下 : 


候 ， 


时 


时 


在 调 


def get namel (argl, arg2): 
print ('1、 我 们 的 名 字 分 别 是 : '，argl,，arg2) 


def get name2 (*args) : 
Print ('*args 的 数据 格式 是 '，args) 
print ('2、 我 们 的 名 字 分 别 是 : '，args[0]，args[1]) 


def get name3(**kwargs): 


print ('**kwargs 的 数据 格式 是 '，kwargs) 
print ('3、 我 们 的 名 字 分 别 是 : '，kwargs['namel'], kwargs['name2']) 


# 调用 函数 

get namel('Lucy', 'Tom') 

get name2('Lily', 'Mary') 

get_ name3 (namel='LiLei', name2='Tony') 


上 述 代码 中 分 别 讲述 了 函数 参数 的 三 种 使 用 方式 ， 三 种 参数 类 型 在 定义 和 调用 的 时 
需要 注意 相关 的 细节 ， 具 体 说 明 如 下 : 


(1) 参数 argl 和 arg2 是 一 个 单独 的 函数 参数 ， 参 数值 可 以 是 任意 的 数据 类 型 ， 在 调 
， 参 数值 传 入 的 先后 顺序 与 参数 名 相互 对 应 。 

(2) *args 将 多 个 参数 值 组 合成 元 组 传递 给 函数 ， 使 用 该 方式 无 需 定义 参数 名 。 在 调 
， 参 数值 的 传 入 顺序 决定 它 在 元 组 里 的 下 标 索引 。 

(3) **kwargs 将 参数 转换 成 字典 的 形式 ， 参 数值 的 读 取 方 式 与 字典 的 读 取 方 式 一 致 ， 
用 时 ， 必 须 设置 参数 名 与 参数 值 。 


在 PyCharm 里 运行 上 述 代码 ， 运 行 结果 如 图 5-1 所 示 。 


1、 我 们 的 名 字 分 别 是 : Lucy Tom 
*args 的 数据 格式 是 (Lily ， "Mary ) 
2、 我 们 的 名 字 分 别 是 : Lily Mary 


##kkwargs 的 数据 格式 是 fnamel : "LiLei’， 
3、 我 们 的 名 字 分 别 是 : LiLei Tony 


图 5-1 函数 参数 
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: “Tony } 


此 外 ， 参 数 的 三 种 使 用 方式 可 以 灵活 组 合 使 用 ， 在 函数 调用 时 ， 需 要 注意 参数 的 传 入 
顺序 和 传 入 方式 。 具 体 的 代码 如 下 : 


# 参数 argl 和 arg2 的 灵活 使 用 
def get namel (argl, arg2="'Lucy'): 


print ('argl 和 arg2 的 名 字 分 别 是 : '，argl,，arg2) 


# 三 种 函数 调用 方式 

get namel ('Tom') 

get namel('Tom', "Lily") 

get namel (arg2='Tom', argl="'Lily') 


# 三 种 函数 参数 组 合 使 用 


def get name2(argl, arg2, *args, **kwargs): 


print ('argl 和 arg2 的 名 字 分 别 是 : '，argl，arg2) 
print ('*args 的 名 字 分 别 是 : '，args[0]，args[1]) 
print ('**kwargs 的 名 字 分 别 是 : '，kwargs['name']) 


# 调用 函数 


get name2('Lucy', "Tom'， 'Lily', "Mary'，hname='Jack') 


上 述 代码 分 别 定义 函数 get_namel 和 get_name2: get_namel 讲述 自 定义 参数 的 多 种 使 


py 


日 旋 


mn 


式 ; get_name2 是 三 种 函数 参数 的 组 合 使 用 。 具 体 的 说 明 如 下 : 
(1) 在 定义 自 定义 参数 的 时 候 ， 除 了 定义 参数 名 之 外 ， 还 可 以 定义 它 的 默认 值 。 在 调 


依次 传递 ， 否 则 在 定义 和 使 用 过 程 中 都 会 提示 错误 信息 。 


目 函 数 时 ， 如 果 没 有 对 该 参数 传递 数据 ， 则 该 参数 的 参数 值 为 默认 值 ， 仍 可 在 函数 里 使 
; 如 果 对 已 设置 默认 值 的 参数 进行 数据 传递 ， 则 参数 值 为 函数 调用 时 所 传递 的 数据 。 


(2) 在 函数 外 调用 函数 的 时 候 ， 数 据 传递 顺序 可 以 自 定义 排序 ， 传 递 过 程 中 必须 指定 
已 定义 的 参数 ， 如 get namel(arg2='Tom' argl='Lily)。 
(3) 三 种 函数 参数 组 合 使 用 时 ， 参 数 的 定义 顺序 最 好 按照 上 述 例子 ， 而 且 数 据 最 好 也 
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5.3 ”函数 的 返回 值 


我 们 知道 ， 函 数 与 函数 外 的 程序 之 间 存 在 输入 输出 的 关系 ， 上 一 节 中 已 讲述 了 如 何 将 


函数 外 的 数据 传递 到 函数 中 使 用 ， 


本 节 会 讲述 如 何 将 函数 的 处 理 结果 传递 到 函数 外 的 程序 


使 用 。 这 个 传递 过 程 称 为 函数 返回 值 ， 它 是 由 关键 词 retum 和 yield 实现 ， 这 两 个 关键 词 之 
间 存 在 明显 的 差异 : retum 是 在 返回 结果 的 同时 中 断 函 数 的 执行 ，yield 则 是 返回 结果 并 不 


中 断 函数 的 执行 。 


对 于 retum 的 作用 比较 容易 理解 ， 可 能 yield 比较 难以 理解 。yield 可 以 理解 为 “轮转 容 
器 ”， 好 比 现实 中 的 实物 一 一 水 车 ， 首 先 yield 可 以 装 入 数据 、 函 数 运行 完毕 后 就 会 生成 
友 代 器 返回 到 主 程序 中 ， 迭 代 器 是 Python 的 特性 之 一 。 
next(0) 来 读 取 里 面 的 数据 。 函 数 中 使 
动 后 ， 车 轮 上 的 水 槽 装 入 水 ， 随 着 轮子 转动 ， 一 个 个 水 槽 就 会 装 入 水 ; 在 主 程序 中 读 取 过 


一 个 迭代 器 (generator object) 并 将 
在 主 程序 中 ， 和 迭代 器 可 以 使 


代 器 的 数据 好 比 一 个 个 水 槽 的 水 送 
述 关 键 词 retum 和 yield 的 差异 : 


# 定义 函数 
def myReturn () : 
for i in range(5) : 
return i 
# 定义 函数 
def myYield() : 
for i in range(5) : 
yield i 


# 调用 函数 myReturn 

Fresultl = myReturn() 
print ('return 数据 类 型 是 : '， 
# 调用 函数 myYield 
result2 = myYield() 
print ('yield 数据 类 型 是 : " 
for i in result2: 


入 水 道中 并 流入 田 里 。 


type (result1)) 


7 type(result2)) 


print (' 这 是 yield 里 面 的 数据 : '，i) 


根据 函数 myRetum 和 myYield 分 析 ， 两 者 的 代码 是 相 


分 别 使 用 retum 和 yield; 函数 的 调 


j yield 好 比 水 车 转 


下 面 我 们 以 代码 的 形式 进一步 讲 


似 的 ， 唯 一 的 不 同 在 于 返回 值 是 


方式 也 相同 ， 唯 独 调 


后 的 结果 是 不 同 的 。 
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从 返回 结果 resultl 和 result2 来 看 ，resultl 是 一 个 数字 类 型 的 数据 ， 数 值 为 0， 也 就 说 
函数 myRetum 在 第 一 次 循环 的 时 候 ， 关 键 词 retum 将 第 一 次 循环 的 值 返回 到 主 程序 ， 而 函 
数 本 身 不 再 执行 任何 操作 。result2 是 一 个 generator 对 象 ， 这 代表 是 一 个 迭代 器 ， 通 过 for 
循环 将 迭代 器 里 面 的 数据 输出 ， 发 现 数 值 从 0 到 4， 这 些 数 值 恰好 是 函数 myYield 每 次 循环 


的 数值 。 运 行 结果 如 图 5-2 所 示 。 


return 数 据 类 型 是 : <class 'int > 
yield 数 据 类 型 是 : 《class ' generator > 
这 是 yield 里 面 的 数据 : 0 

这 是 yield 里 面 的 数据 : 


这 是 yield 里 面 的 数据 : 
这 是 yield 里 面 的 数据 : 
这 是 yield 里 面 的 数据 : 


图 5-2 函数 返回 值 


5.4 ”函数 的 调用 


函数 调用 大 家 在 前 两 节 中 有 所 接触 ， 函 数 调用 是 指 可 以 在 函数 里 面 调用 其 他 函数 ， 也 
可 以 在 主 程序 里 面 调用 函数 。 函 数 的 调用 方式 是 使 用 “函数 名 + 花 括 号 ”， 程 序 首先 找到 人 花 
括号 ， 认 定 当前 语句 代表 函数 调用 ， 然 后 根据 函数 名 去 查找 相应 的 函数 并 执行 。 下 面 通过 
代码 来 演示 函数 调用 函数 和 主 程序 调用 函数 的 例子 : 


def funl() : 
print (" 咽 ， 我 是 函数 fun1 7 ) 


def fun2 (name) : 
print ('" 嘿 ， 我 是 函数 fun2， 我 的 名 字 叫 : '，name，'， 现 在 我 要 呼喊 fun2') 
# 调用 函数 fun1 
Eunl () 


def fun3 (name) : 


print(' 嘿 ， 我 是 函数 fun3， 我 的 名 字 叫 : '，name， '， 现 在 我 要 呼喊 fun3') 
# 调用 函数 fun2 
fun2('Lily') 
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# 主 程序 
if name =="' main ": 


fun3('Lucy') 

上 述 代 码 中 ， 分 别 定义 了 函数 fun1、fun2 和 fun3。 代 码 过 ”name 一 ' main ' 下 的 
代码 是 当前 文件 的 主 程序 代码 。 当 程序 运行 的 时 候 ， 主 程序 首先 调用 并 执行 函数 fun3; 在 
fun3 里 ， 它 调用 并 执行 函数 fun2; 而 fun2 调用 并 执行 函数 fhtn1， 这 样 形成 一 个 嵌 套 的 函数 
调用 。 代 码 的 运行 结果 如 图 5-3 所 示 。 


嘿 ， 我 是 函数 fun3， 我 的 名 字 叫 : Lucy ， 现 在 我 要 呼喊 fun3 
嘿 ， 我 是 函数 fun2， 我 的 名 字 叫 : Lily ， 现 在 我 要 呼喊 fun2 


嘿 ， 我 是 函数 funl 


图 5-3 函数 调用 


函数 之 间 的 调用 很 容易 造成 死 循环 ， 比 如 在 函数 fun2 里 调用 函数 fun1， 而 函数 funl 又 调 
用 函数 fm2， 这 样 就 形成 了 一 个 闭合 的 死 循 环 ， 程 序 就 不 断 地 在 这 两 个 函数 之 间 来 回执 行 。 


5.5 ”变量 的 作用 域 


函数 外 的 程序 与 函数 可 以 进行 数据 交互 ， 正 因 如 此 ， 当 函数 外 的 程序 将 数据 传 入 函数 
并 进行 处 理 时 ， 传 入 的 数据 在 函数 处 理 前 和 处 理 后 会 发 生变 化 。 那 么 函数 执行 完成 后 ， 处 
理 后 的 数据 是 否 会 蔡 换 函数 外 的 程序 数据 呢 ? 对 于 这 一 问题 ， 下 面 通过 代码 来 进行 说 明 : 
def funl() : 


name = "Lucy'" 


print (' 咽 ,我 是 函数 fun1， 我 的 名 字 叫 : '，name) 


if name ==' main ': 
name = "Lily' 
funl () 
print (' 嘿 ， 我 是 主 程序 ， 我 的 名 字 叫 : '，name) 


上 述 代码 中 ， 首 先 定义 变量 name 的 值 ， 然 后 变量 传递 给 函数 ftn1， 函 数 funl 将 参数 
name 重新 赋值 并 输出 ， 函 数 执行 完成 后 ， 主 程序 再 输出 变量 name 的 值 。 通 过 输出 结果 可 
以 发 现 ， 主 程序 的 变量 传 入 到 函数 后 ， 不 管 函 数 怎样 处 理 ， 主 程序 的 变量 值 不 会 发 生 任何 
变化 ， 这 就 是 变量 的 作用 域 。 运 行 结 果 如 图 5-4 所 示 。 
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黑 ， 我 是 函数 fun1， 我 的 名 字 叫 :Lucy 


我 是 主 程序 ， 我 的 名 字 叫 : Lily 


图 5-4 变量 作用 域 的 运用 


变量 的 作用 域 主要 分 为 全 局 变量 和 局 部 变量 : 在 主 程序 里 定义 的 变量 称 为 全 局 变量 ， 
在 函数 内 部 定义 的 变量 称 为 局 部 变量 ， 全 局 变量 在 所 有 作用 域 都 可 读 ， 局 部 变量 只 能 在 本 
函数 里 可 读 ;， 函数 在 读 取 变 量 时 ， 优 先 读 取 函 数 本 身 的 局 部 变量 ， 然 后 再 去 读 全 局 变量 ; 
函数 里 可 以 对 变量 使 用 关键 词 global， 使 变量 定义 成 全 局 变量 。 下 面 以 代码 形式 说 明 全 局 
变量 和 局 部 变量 的 区 别 ; 
## 函数 fun1l 
def funl() : 
# 定义 局 部 变量 name 
funName = "Lucy'" 
# 定义 全 局 变量 
global newName 
newName = 'Mary' 
print (' 咽 ,我 是 局 部 变量 ， 我 的 名 字 叫 : '， funName) 
print (' 嘿 ， 我 是 全 局 变量 ， 我 在 函数 funl 里 面 ， 我 的 名 字 叫 ，' ，name) 
print (' 嘿 ， 我 是 全 局 变量 ， 由 函数 funl 定义 ， 在 函数 里 使 用 ， 我 的 名 字 叫 ，' ，newName) 
# 主 程序 
if name ==' main ': 
# 定义 全 局 变量 name 
name = 'Lily' 
funl () 
print (' 嘿 ， 我 是 主 程序 ， 我 在 主 程序 里 面 ， 我 的 名 字 叫 : '，name) 
print (' 咽 ， 我 是 全 局 变量 ， 由 函数 funl 定义 ， 在 主 程序 里 使 用 ， 我 的 名 字 叫 : ，' 
newName) 


全 


上 述 代码 中 ， 函 数 fonl 分 别 定义 局 部 变量 funName 和 全 局 变量 newName， 主 程序 定义 


局 变量 name。 从 代码 的 输出 结果 可 以 看 到 ， 全 局 变量 name 和 newName 不 限制 使 用 范 


韦 | 


， 各 


局 部 变量 funName 只 能 在 函数 里 使 用 。 代 码 运 行 结果 如 图 5-5 所 示 。 


黑 ， 我 是 局 部 变量 ， 我 的 名 字 叫 :Lucy 
黑 ， 我 是 全 局 变量 ， 我 在 函数 fun1 里 面 ， 我 的 名 字 叫 ， Lily 
归 ， 我 是 全 局 变量 ， 由 函数 fun1 定 义 ， 在 函数 里 使 用 ， 我 的 名 字 叫 ， Mary 


时 ， 我 是 主 程序 ， 我 在 主 程序 里 面 ， 我 的 名 字 叫 : Lily 
归 ， 我 是 全 局 变量 ， 由 函数 fun1 定 义 ， 在 主 程序 里 使 用 ， 我 的 名 字 叫 : Mary 


图 5-5 局 部 变量 和 全 局 变量 的 使 用 
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5.6 实战: 编写 “ 猪 词 语 ” 游 戏 


本 节 我 们 利用 函数 来 实现 一 个 “ 猜 词语 ”的 小 游戏 。 游 戏 规则 分 为 三 组 队伍 ， 三 组 队 
伍 依 次 开始 游戏 ， 每 组 队伍 至 少 两 个 人 ， 根 据 程序 给 出 的 词语 ， 一 人 比划 一 人 猜 ， 比 划 的 
时 候 可 以 使 用 肢体 语言 或 口头 语言 向 猜 词 者 传达 信息 ， 但 口头 语言 不 能 与 词语 的 内 容 相 
关 ， 只 能 对 词语 进行 描述 表达 ， 每 组 队伍 的 游戏 限时 为 1 分 钟 ， 游 戏 结束 后 统计 答对 的 题 
数 ， 最 后 答对 数量 最 多 的 那 组 获胜 。 

分 析 游 戏 规则 ， 整 个 比赛 共有 三 组 队伍 参加 ， 每 组 队伍 玩 的 游戏 都 是 一 样 的 ， 那 么 三 


组 队伍 可 以 看 作 是 三 次 遍历 循环 的 函数 。 在 这 个 函数 里 ， 每 次 循环 代表 当前 队伍 的 游戏 


始 与 结束 ， 游 戏 开始 与 结束 也 可 以 看 成 另外 一 个 函数 。 简 单 地 说 ， 三 组 队伍 看 成 函数 A， 


日 司 吉 


猜 词 语 游戏 看 成 函数 B， 在 函数 A 里 需要 调用 函数 B。 有 具体 的 代码 如 下 所 示 


import time 
# 每 组 队伍 的 游戏 过 程 
def guess (i): 
correct = 0 
start=time.time() 
for k in range(len(i)) : 
# 显示 词语 
Piolo ES S(T 
flag = input (' 请 答题 ,答对 请 输入 y, 跳 过 请 输入 任意 键 ') 
sec = time.time() - start 
统计 用 时 
if (50 <= sec <= 60) : 
print (' 还 有 10 秒 钟 ') 
if (sec >= 60): 
print (' 时 间 到 ! 游戏 结束 ') 
break 
# 答对 就 累加 1 
IE (flLag == “ys 
COrrect 4= 1 
continue 
SL3es 
continue 


return correct 


和 开 


判断 


为 有 


参数 。 
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# 遍历 每 组 队伍 ， 调 用 answer 函数 实现 游戏 
def team(guessWord) : 
for i in guessWord: 
correct = guess (i) 
str temp = (" 恭 喜 你 ， 你 答对 了 sd 道 题 ') 当 (correct) 
print (str temp) 
Print (' 非 # 间 # 提 提 提 提 提 提 划 提 提 下 一 组 间 提 提 提 提 提 间 提 提 提 提 提 并 间 " ) 


# 主 程序 定义 游戏 内 容 ， 然 后 调用 team 函数 开始 游戏 
站 name ”== ' main 
guessWord = [] 
guessWord.append([' 娇 媚 '， ' 人 金鸡 独 立 '， 狼吞虎咽 ' ， 
' 稚 立 鸡 群 '，' 手 舞 足 蹈 ' ，' 卓 别 林 '，' 穿越 火线 '] ) 
guessWord.append([' 扭 秧歌 '，' 偷 看 美女 '，' 大摇大摆 '， 
"回眸 一 笑 "，“' 市 场 营销 "， ' 自 恋 '， ' 处 女 座 '] ) 
guessWord.append([' 狗 急 跳 墙 ' ，“' 捧 腹 大 笑 '，“ 目不转睛 …， 
' 悉 眉 苦 脸 ' ，' 暗 恋 '，“' 臭 袜子 '，“' 趁 火 打劫 '] ) 


team(guessWord) 


从 上 述 代码 可 以 看 到 ， 我 们 定义 函数 team 和 guess 分 别 代表 队伍 和 游戏 。 首 先 分 析 函 
数 guess， 具 体 说 明 如 下 : 


(1) 函数 guess 是 整 段 代码 中 最 底层 的 函数 ， 也 是 实现 猜 词 语 
(2) 函 数 参 数 i 代 表 当 前 队伍 的 词语 题目 ， 函 数 变 量 correct 和 
始 时 间 。 


的 游戏 功能 。 
start 代表 答对 的 题目 数 


(3) 函数 里 面 的 循环 是 将 词语 的 题目 遍历 并 输出 ， 每 条 题目 通过 比划 者 输入 的 内 容 来 


当前 题目 是 答对 或 跳 过 。 


(4) 在 这 个 遍历 过 程 中 加 入 时 间 的 计算 和 判断 ， 超 时 会 自动 中 断 循环 。 
(5) 如 果 答 对 了 题目 ， 函 数 变 量 correct 累加 1， 否 则 进行 下 一 次 循 坏 。 


然后 分 析 函 数 team 所 实现 的 功能 ， 有 具体 说 明 如 下 : 


(1) 函数 team 是 通过 循环 词组 guessWord，guessWord 是 该 函 


的 二 维 列表 ， 也 就 是 说 列表 有 三 个 元 素 ， 每 个 元 素 是 一 个 列表 。 


(2) 每 次 循环 guessWord 得 到 它 的 元 素 值 ， 然 后 调用 guess 函 


数 参数 并 且 是 一 个 长 度 


数 并 将 元 素 值 作为 函数 


(3) 最 后 获取 guess 函数 的 返回 值 ， 返 回 值 是 代表 当前 队伍 答对 的 题目 数量 。 
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最 后 在 主 程序 中 ， 定 义 guessWord 列表 并 设置 列表 的 元 素 值 ， 然 后 调用 team 函数 并 将 
列表 guessWord 传递 进去 。 从 整 段 代 码 来 看 ， 主 程序 最 初 调用 team 函数 ， 在 执行 team 函数 
的 时 候 ， 每 次 循环 都 会 调用 guess 函数 。 从 主 程序 调用 函数 tetam， 再 到 函数 team 调用 函数 
guess， 一 层 嵌 套 一 层 ， 每 次 的 调用 都 通过 函数 参数 和 返回 值 进行 关联 。 


5.7 本 章 小 结 


函数 以 关键 词 def 开头 ， 关 键 词 后 是 自 定义 的 函数 名 ， 函 数 名 后 面 添加 英文 格式 的 小 
括号 ， 而 小 括号 里 面 可 以 根据 情况 来 决定 是 否 设置 函数 参数 。 

函数 参数 是 将 外 部 的 数据 传 入 到 函数 里 使 用 ， 它 对 于 函数 来 说 ， 并 非 必要 的 ， 如 果 函 
数 无 需 使 用 参数 ， 则 在 定义 函数 的 时 候 无 需 设 置 参 数 ， 如 果 函 数 需要 使 用 参数 ， 则 可 以 根 
据 实 际 情况 进行 定义 。 

函数 返回 值 是 将 函数 的 数据 传递 给 函数 外 的 程序 使 用 ， 它 由 关键 词 retum 和 yield 实 
现 ， 这 两 个 关键 词 之 间 存 在 明显 的 差异 : retum 是 在 返回 结果 的 同时 中 断 函 数 的 执行 ， 而 
yield 则 是 返回 结果 并 不 中 断 函 数 的 执行 。 
函数 调用 可 以 在 函数 里 面 调用 其 他 函数 ， 也 可 以 在 主 程序 里 面 调用 函数 。 函 数 的 调用 
方式 是 使 用 “函数 名 + 花 括号 ”， 程 序 首先 找到 花 括 号 ， 认 定 当前 语句 代表 函数 调用 ， 然 后 
根据 函数 名 去 查找 相应 的 函数 并 执行 。 
函数 在 执行 的 时 候 ， 如 果 函 数 内 外 有 两 个 相同 的 变量 名 ， 在 没有 使 用 关键 词 global 对 
变量 进行 特别 声明 的 时 候 ， 两 个 变量 是 互 不 影响 的 ， 若 在 函数 内 使 用 关键 词 global， 则 变 
量 视 为 一 个 全 局 变量 ， 等 同 于 函数 外 的 同名 变量 。 


本 章 讲 述 Python 的 类 与 对 象 ; 类 的 定义 、 类 的 封装 与 继承 。 类 的 定义 主要 讲述 类 属性 
和 内 置 方法 的 使 用 ， 类 的 封装 主要 讲述 类 的 私有 属性 、 公 有 属性 、 私 有 方法 和 普通 方法 的 
差异 与 使 用 ， 类 的 继承 主要 讲述 类 与 类 之 间 的 继承 关系 、 属 性 与 方法 的 读 取 和 重 写 。 


6.1 类 的 使 用 


Python 是 面向 对 象 的 编程 语言 ， 对 象 不 是 我 们 常 说 的 男女 对 象 ， 而 是 一 种 抽象 概念 。 
编程 是 为 实现 某 些 功能 或 解决 某 些 问题 ， 在 实现 的 过 程 中 ， 需 要 将 实现 过 程 具体 化 。 好 比 
现实 中 某 些 例子 ， 如 超市 购物 ， 在 超市 购物 的 时 候 ， 购 买 者 挑选 自己 所 需 的 物品 并 完成 支 
付 ， 这 是 一 个 完整 的 购物 过 程 。 在 这 个 过 程 中 ， 购 买 者 需要 使 用 自己 的 手 和 脚 去 完成 一 系 
列 的 动作 ， 如 挑选 自己 物品 ， 走 到 收银 台 完 成 支付 。 

如 果 使 用 编程 的 语言 解释 这 个 购物 过 程 ， 这 个 购买 过 程 好 比 主 程序 ， 购 买 者 可 被 比喻 


成 一 个 对 象 ， 购 买 者 的 手 和 


成 ， 相 当 于 主 程序 的 代码 是 


对 象 的 


为 属性 和 方法 ， 属 性 就 好 比 人 的 姓名 、 性 别 和 学 历 等 ， 上 


邯 就 是 对 象 的 属性 或 方法 。 
属性 或 方法 来 实现 。 
类 是 对 象 的 一 个 具体 描述 ， 对 象 的 属性 和 方法 都 是 


购买 的 过 程 由 购买 者 的 手 和 脚 完 


类 进行 定义 和 设置 的 。 类 主要 分 


于 对 人 的 描述 ; 方法 就 如 人 的 四 
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肢 和 五 官 ， 可 以 实现 某 些 简单 的 操作 。 完 整 的 类 定义 的 语法 如 下 : 


class Person (object) : 


# 定义 静态 属性 


name = ' 小 黄 ' 


# 定义 动态 属性 

def init {self): 
"nn init 是 类 的 初始 化 方法 """ 
self.age = "18" 


# 定义 普通 方法 
def foot(self): 
wnw 至 少 有 一 个 self 参数 """ 
print (' 这 是 我 的 脚 ， 由 普通 方法 实现 ') 


# 定义 类 方法 ， 由 classmethod 装饰 器 实现 
@classmethod 
def class hand(cls): 
wn 至 少 有 一 个 cls 参数 """ 
print (' 这 是 我 的 手 ， 由 类 方法 实现 ' ) 


# 定义 静态 方法 ， 由 staticmethod 装饰 器 实现 
@staticmethod 
def static mouth(): 

ww 无 默认 参数 "ww 

print (" 这 是 我 的 嘴 ， 由 静态 方法 实现 ') 


流下 name == "' main ': 
# 获取 静态 属性 
# 方法 1， 直接 调用 
print (' 静 态 属 性 : '，Person.name) 
# 方法 2， 实 例 化 后 再 调用 


person = Person() 


print (' 静 态 属性 : '，person.name) 


# 获取 动态 属性 
person = Person() 
print (' 动 态 属性 : '，person.age) 
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间 调用 普通 方法 
person = Person() 


person.foot () 


# 调用 类 方法 

# 方法 1， 直接 调用 
Person.class hand() 
# 方法 2， 实 例 化 后 再 调用 
person = Person() 
person.class hand() 


# 调用 静态 方法 

# 方法 1， 直接 调用 
Person.static mouth() 
# 方法 2， 实 例 化 后 再 调用 
person = Person() 
person.static mouth() 


类 的 定义 由 关键 词 class 实现 ， 关 键 词 class 后 面 为 类 名 ， 这 个 可 以 自 定义 命名 


; 类 名 后 


面 是 一 个 小 括号 和 object 类 ， 这 是 Python 的 新 式 类 。Python 的 类 分 为 新 式 类 和 经 典 类 ， 经 


类 此 处 不 做 详细 讲述 ， 有 兴趣 的 读者 可 以 自行 研究 。 


典 类 在 日 常 开 发 中 不 建议 使 用 ， 现 在 都 是 使 用 新 式 类 进行 定义 。 有 关 Python 的 新 式 类 和 经 


在 上 述 类 的 定义 语法 中 ，Person 类 定义 了 类 的 属性 和 方法 ， 类 属性 又 分 为 静态 属性 和 动 


态 属性 ， 类 的 方法 分 为 普通 方法 、 类 方法 和 静态 方法 。 静 态 属性 和 动态 属性 的 最 大 


区 别 在 于 


使 用 方式 的 不 同 ， 前 者 具备 两 种 使 用 方式 ， 后 者 需要 将 类 实例 化 后 才能 使 用 。 普 通 方法 、 类 
方法 和 静态 方法 也 是 如 此 ， 前 者 只 能 实例 化 后 才能 使 用 ， 后 两 者 具备 两 种 使 用 方式 。 
在 类 定义 中 ， 我 们 留意 到 关键 词 self， 这 个 关键 字 代 表 类 本 身 ， 这 也 说 明 带 有 self 的 变 


量 或 方法 是 当前 类 所 定义 的 动态 属性 或 方法 。 代 码 运行 结果 如 图 6-1 所 示 。 


静态 属性 : 小 黄 
静态 属性 : ”小 黄 
动态 属性 : 18 
这 是 我 的 脚 ， 由 普通 方法 实现 


这 是 我 的 手 ， 由 类 方法 实现 
这 是 我 的 手 ， 由 类 方法 实现 
这 是 我 的 嘴 ， 由 静态 方法 实现 
这 是 我 的 嘴 ， 由 静态 方法 实现 


图 6-1 类 定义 的 运行 结果 
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在 定义 类 的 时 候 ， 类 会 自动 生成 许多 内 置 方法 。 如 代码 中 的 _init_ 初 始 化 方法 ， 类 在 
实例 化 的 时 候 ， 首 先 自动 执行 _init 初始 化 方法 。 上 述 的 Person 类 是 自 定义 类 的 初始 化 方 
法 ， 如 果 在 定义 类 的 时 候 ， 没 有 特殊 要 求 ， 可 以 不 用 重 写 初 始 化 方法 。 如 果 在 初始 化 方法 
里 面 设置 类 的 参数 ， 在 调用 类 的 时 候 ， 类 的 实例 化 也 应 设置 相应 的 参数 。 具 体 的 使 用 方式 如 
下 述 代码 所 示 : 


class Person(object): 
def init (self, name): 
""" 重 写 init 并 设置 实例 化 参数 name """ 


self.name = name 


站 name == "' main ': 
# Person 类 在 实例 化 时 必须 设置 参数 name 的 值 


person = Person(' 小 黄 ') 


print (person.name) 


上 述 代码 演示 了 __init 初始 化 方法 的 使 用 方式 ， 在 实际 的 开发 中 ， 是 否 重 写 初始 化 方 
法 应 根据 功能 实现 方式 而 决定 。 此 外 ， 类 还 具有 以 下 常用 的 内 置 方法 ， 如 表 6-1 所 示 。 


表 6-1 类 的 内 置 方法 


类 的 内 置 方法 说 ”有明 

__ init (self,...) 初始 化 方法 ， 在 类 实例 化 的 时 候 执 行 调用 
_del (self) 释放 类 对 象 ， 在 对 象 被 删除 之 前 执行 调 必 

_ new_ (cls, *args, **kwd) 在 类 实例 化 生成 对 象 时 执行 ， 先 执行 该 方法 再 执行 初始 化 方法 
_str (self) 在 使 用 print 时 被 调用 

__ getitem (self, key) 获取 索引 key 对 应 的 值 ， 等 价 于 seq[key] 

_ len (self) 在 调用 内 联 函数 lenO 时 被 调用 ， 计 算数 值 长 度 
emp (ste, dst) 两 个 类 stc 和 dst 的 比较 

_ getattr _(s, name) 获取 name 属性 的 值 

_setattr _(s, name, value) 设置 name 属性 的 值 

_ delattr _(s, name) 删除 name 属性 

__ getattribute _() getattribute _ 0 〇 功能 与 ”getatt _0 类 似 

_ gt (self, other) 判断 类 本 身 是 否 大 于 other 类 

_ lt (slef, other) 判断 类 本 身 是 否 小 于 other 类 

_ ge _ (slef, other) 判断 类 本 身 是否 大 于 或 者 等 于 other 类 

_le_ (slef, other) 判断 类 本 身 是 否 小 于 或 者 等 于 other 类 
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( 续 表 ) 
类 的 内 置 方法 说 ” 明 
_ eq (slef, other) 判断 类 本 身 是 否 等 于 other 类 
__call (self, *args) 把 类 实例 作为 函数 调 


类 的 使 用 在 上 述 例子 中 已 经 有 所 提 及 ， 在 调用 类 的 属性 和 方法 之 前 ， 建 议 将 类 实例 化 


后 再 使 
现 某 些 


6.2 


圭 
要 把 三 
析 二 维 
子 得 和 
即 可 实 


象 ， 调 
的 某 些 
在 类 

对 
层 封装 


类 的 封装 


用 。 类 的 实例 化 也 称 为 对 象 ， 类 在 实例 化 之 后 ， 可 以 直接 调用 类 的 属性 或 方法 来 实 
功能 或 操作 ， 这 就 是 面向 对 象 的 编程 思想 。 


装 在 我 们 日 常生 活 中 都 能 看 到 和 接触 和 到， 比如 在 使 用 支付 宝 进行 付款 的 时 候 ， 只 需 
维 码 给 收 款 方 或 扫 一 下 收 款 方 提供 的 二 维 码 就 可 以 完成 支付 ， 无 需 知道 程序 如 何 解 
码 以 及 资金 的 交易 流向 ， 其 整个 支付 功能 就 可 以 理解 为 是 经 过 封装 处 理 。 从 这 个 例 
， 封 装 是 将 程序 中 某 些 功能 的 执行 过 程 写 到 函数 或 类 里 面 ， 当 程序 调用 函数 或 类 时 


现 程序 的 功能 。 


Python 的 类 可 以 分 成 两 层 封 装 ， 类 在 实例 化 时 所 生成 的 对 象 看 作 一 个 已 经 封装 好 的 对 
对 象 的 属性 或 方法 来 实现 某 些 功能 ， 
属性 或 方法 封装 起 来 ， 将 其 设置 为 类 的 私有 属性 或 方法 ， 使 得 这 些 属性 和 方法 只 能 
内 部 使 用 ， 无 法 在 类 的 外 部 调用 ， 这 是 类 的 第 二 层 封装 。 


这 是 类 的 第 一 层 封装 。 有 时 候 需 要 把 类 里 面 


于 类 的 第 一 层 封装 ， 相 信 读 者 在 第 6.1 节 中 有 所 了 解 ， 本 节 就 不 再 讲述 。 类 的 第 二 


主要 是 将 类 的 属性 或 方法 设置 为 私有 ， 


只 允许 在 类 的 内 部 使 用 。 定 义 私 有 属性 或 方 


法 只 需要 在 属性 名 和 方法 名 之 前 加 双 下 划 线 即 可 ， 具 体 的 代码 如 下 : 


如 下 


ass Person (object) : 

# 定义 私有 属性 name 和 公有 属性 age 

def init (self, name): 
Self. name = name 
self.age = 10 

# 定义 私有 方法 

def _get age(self) : 
""" 在 方法 名 前 面 加 双 下 划 线 """ 
return self.age 


# 定义 普通 方法 
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def get name (self): 


return self. name 


入 name = "' main 


p = Person('Lili') 
# 读 取 公有 属性 和 普通 方法 
print (' 公 有 属性 age 的 属性 值 :'，p.age) 


print (' 公 有 方法 get name 的 返回 值 :'，p.get name () ) 


# 强制 读 取 私有 属性 和 调用 私有 方法 


print (' 强 制 读 取 私有 属性 ， 属 性 值 : '，p._Person name) 
print (' 强 制 调 用 私有 方法 ， 返 回 值 : '，p._Person get age()) 


上 述 代 码 分 别 定义 私有 属性 _name、 公 有 属性 


age、 私 有 方法 ”get age 和 普通 方法 


get_name。 在 主 程序 中 ， 将 类 实例 化 生成 对 象 p， 然 后 对 象 p 只 能 获取 公有 属性 age 的 属性 
值 和 调用 公有 方法 get_ name， 如 果 对 象 p 调 用 私有 属 
会 提示 AttributeError: 'Person' object has no attribute ' name' 等 错误 信息 。 但 这 并 不 代表 无 法 


在 类 的 外 部 读 取 私 有 属性 和 调用 私有 方法 ， 可 以 使 


性 _name 和 私有 方法 “get_ age， 程序 


强制 性 的 方式 来 获取 私有 属性 和 调用 


私有 方法 ， 如 p. Person name 或 p. Person ”get age()， 但 在 日 常 开发 中 , 则 不 提倡 这 种 强 
制 性 的 操作 方式 。 代 码 运行 结果 如 图 6-2 所 示 。 


公有 属性 age 的 属性 值 : 10 
公有 方法 get_name 的 返回 值 : 


强制 读 取 私 有 属性 ， 属 性 值 ; 
强制 调用 私有 方法 ， 返 回 值 ; 


Lilt 
Lili 
10 


图 6-2 类 封装 的 运行 结果 


6.3 ”类 的 继承 


ss 


继承 常用 于 父母 与 子女 之 间 ， 比 如 子女 的 外 貌 长 得 像 父母 ， 这 是 因为 子女 的 基因 是 来 
自 于 父母 。 编 程 语言 中 的 继承 也 是 如 此 ， 比 如 在 定义 Student 类 的 时 候 ， 可 以 使 Student 类 


本 


写 父 类 的 属性 和 方法 或 自 定义 新 的 属性 和 方法 。 下 


# 定义 父 类 Person 


class Person (object) : 


类 承 Person 类 ， 使 得 子 类 Student 拥有 父 类 Person 的 所 有 属性 和 方法 ， 而 且 子 类 Student 可 


1 通过 示例 来 说 明 类 的 继承 : 


如 
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# 定义 私有 属性 name 和 公有 属性 age 


def init (self, name): 


self. name = name 


self.age = 10 

# 定义 私有 方法 

def _ get age(self) : 
""" 在 方法 名 前 面 加 双 下 划 线 """ 
return self.age 

# 定义 普通 方法 

def get name (self): 


return self. name 


# 定义 子 类 Student 
class Student (Person): 
# 自 定义 普通 方法 
def student name(self): 


# 


继承 Person， 通 过 强制 操作 方式 来 获取 父 类 的 私有 属性 


return self. Person name 


证 name = maln ": 


s = Student('Lucy') 


# 调 
print 


父 类 的 普通 方法 get_name 
(' 调 用 父 类 的 普通 方法 : '，s.get name () ) 


# 调用 
print 


# 调用 
print 


父 类 的 私有 方法 

(' 调 用 父 类 的 私有 方法 : '，s._Person get age()) 
自 定义 的 普通 方法 student_age 

(' 这 是 Student 类 的 名 字 : '，s.student_name () ) 


从 子 类 Student 的 定义 来 看 ， 类 名 Student 后 面 的 小 括号 里 Person 是 指向 父 类 Person， 
这 是 将 Student 类 继承 Person 类 ， 如 果 Student 类 需要 继承 多 个 类 ， 可 以 在 小 括号 里 填写 ， 
每 个 类 之 间 使 用 英文 格式 的 逗号 隔 开 。 在 子 类 Student 里 面 ， 只 是 定义 了 普通 方法 
student_ name， 由 于 它 的 父 类 是 Person， 因 此 它 还 具有 父 类 的 属性 _name 和 age、 父 类 的 方 
法 _get age 和 get_ name。 

在 主 程序 中 ， 子 类 Student 首先 实例 化 生成 对 象 s， 在 实例 化 时 需要 设置 参数 ， 因 为 子 
类 Student 继承 了 父 类 Person 的 初始 化 方法 _init _。 对 象 s 可 以 调用 Student 所 有 的 属性 和 
方法 ， 对 于 父 类 的 私有 属性 和 私有 方法 可 以 使 用 强制 性 的 操作 方式 来 实现 。 代 码 运 行 结果 


图 6-3 所 示 。 
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调用 父 类 的 普通 方法 : Lucy 
调用 父 类 的 私有 方法 : 10 


这 是 Student 类 的 名 字 : Lucy 


图 6-3 类 继承 的 运行 结果 


6.4 实战 : 编写 “过 家 家 ”游戏 


我 们 根据 类 的 特性 可 以 使 用 类 来 实现 一 些 日 常生 活 的 场景 。 以 某 一 个 家 庭 的 日 常生 活 


为 例 ， 这 个 家 庭 中 有 三 个 成 员 : 父亲 、 母 亲 和 儿 子 ， 三 者 组 成 一 个 家 庭 ， 每 
姓名 、 年 龄 及 个 人 小 秘密 。 


个 人 有 


己 的 


细心 分 析 这 个 场景 可 以 发 现 ， 一 个 家 庭 里 有 三 个 成 员 ， 每 个 成 员 有 自己 的 一 些 特性 
但 又 隶属 于 这 个 家 庭 。 从 编程 的 角度 来 看 ， 家 庭 可 以 定义 为 一 个 父 类 ， 父 类 的 属性 是 家 庭 


每 个 成 员 共 有 的 特性 ， 而 每 个 成 员 为 一 个 子 类 ， 子 类 具有 父 类 的 属性 之 外 ， 还 有 一 些 


特有 的 属性 。 根 据 上 述 分 析 ， 得 到 功能 代码 : 


import random 
class Family(): 
# 自 定义 初始 化 方法 
def init (self, surname, address, income): 
"wm 设置 家 庭 姓 氏 """ 
self.surname = surname 
self.address = address 
self.income = income 


class Father (Family): 

def init {self, name, age): 
""" 继承 父 类 的 动态 属性 """ 
super (Family, self). init () 
# 定义 动态 属性 
self.name = name 
self.age = age 
self. secret = ' 我 外 面 有 人 ' 

def action(self): 
money = random.randint (100, 1000) 


return money 


六 


CC 


class Mother (Family): 
def init (self, name, age): 
""" 继承 父 类 的 动态 属性 """ 
super (Family, self). init _() 
# 定义 动态 属性 
self.name = name 
self.age = age 
self. secret = ' 我 存 有 很 多 私房 钱 ' 
def action(self) : 
money = random.randint (100, 500) 
return -money 


class Son (Family) : 

def init (self, name, age): 
wn 继承 父 类 的 动态 属性 """ 
super (Family, self). init _() 
定义 动态 属性 
self.name = name 
self.age = age 
self. secret = ' 我 喜欢 隔壁 的 小 花 ' 

def action(self) : 
money = random.randint (0, 100) 
return -money 


六 下 name == "' main ': 
# 将 4 个 类 实例 化 ， 生 成 对 象 
family = Family(' 李 "， "广州 市 "，1000) 
father = Father(' 利 海 '，35) 
mother = Mother (' 郝 玫 丽 '，33) 
son = Son(" 豪 烨 '，10) 


# 家 庭 的 自我 介绍 
print (' 这 是 一 个 姓 ' + family.surname + 
' 的 家 庭 ， 他 们 生活 在 ' + family.address) 
print (' 我 是 父亲 一 ' + family.surname + father.name + 
今年 ' + str(father.age) + ' 岁 ,。') 
print (' 我 是 母亲 一 ' + mother.name + 
"今年 ' + str (mother.age) + ' 岁 。') 
print (' 我 是 儿子 一 ' + family.surname + son.name + 
' ,今年 ' + str(son-age) + ' 岁 。') 
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家 庭 费用 开支 


father money = father.action() 


family.income += father money 

Print (' 父 亲 今 天 赚 了 ' + str (father money) + ' 元 ， 
家 庭 资产 剩余 ' + str (family.income)) 

mother money = mother.action() 

family.income += mother money 

print (' 母 亲 今天 花 了 ' + str (-mother money) + ' 元 ， 
家 庭 资 产 剩余 ' + str (family.income)) 

son money = son.action() 

family.income += son money 

print (' 儿 子 今天 花 了 ' + str(-son money) + ' 元 ， 
家 庭 资产 剩余 ' + str (family.income)) 


# 家 庭 成 员 的 小 秘密 

print (' 父 亲 告 诉 你 一 个 小 秘密 : ' + father. Father secret) 
print (' 母 亲 告 诉 你 一 个 小 秘密 : ' + mother. Mother secret) 
Print (' 儿 子 告诉 你 一 个 小 秘密 : ' + son. Son secret) 


上 述 代码 定义 了 4 个 类 ， 父 类 是 Family， 子 类 分 别 是 Father、Mother 和 Son。 代 码 中 调 
用 标准 库 random， 用 于 生成 随机 数字 ， 作 为 家 庭 的 日 常 收 支 情况 。 我 们 对 代码 进行 分 析 
说 明 。 


e@ ， Family 类 : 用 于 描述 家 庭 的 基本 情况 ， 如 这 个 家 庭 的 姓氏 、 住 址 和 资产 。 在 初始 化 方 
法 里 分 别 设置 动态 属性 surname、address 以 及 income， 代 表 家 庭 的 姓氏 、 住 址 和 资产 。 

e@ Father、Mother 和 Son 类 : 用 于 描述 各 个 家 庭 成 员 。 在 重 写 初 始 化 方法 的 时 候 ， 使 用 
super(Family，self).， init 0 可 以 把 父 类 的 初始 化 方法 所 定义 的 动态 属性 surmame、 
address 以 及 income 一 并 继承 到 子 类 的 初始 化 方法 。 如 果 不 使 用 super 函 数 的 话 ， 子 类 重 
写 初 始 化 方法 会 覆盖 父 类 的 初始 化 方法 。 若 想 子 类 也 继承 父 类 的 属性 ， 要 么 在 子 类 重 
写 初 始 化 方法 时 重新 定义 父 类 的 属性 ， 要 么 就 使 用 super 函 数 继承 。 


每 个 子 类 都 定义 了 动态 属性 name 和 age， 私 有 属性 _secret 以 及 普通 方法 action。 在 子 
类 实例 化 的 时 候 需 要 设置 动态 属性 name 和 age 的 属性 值 ， 私 有 属性 _ secret 是 通过 强制 性 
方法 调用 属性 值 ， 在 调用 普通 方法 action 时 就 会 自动 生成 一 个 随机 整数 并 将 数值 返回 ， 这 
是 用 于 家 庭 资产 的 计算 。 

在 代码 的 主 程序 中 ， 通 过 print 函数 来 实现 家 庭 信息 的 输出 ， 运 行 结果 如 图 6-4 所 示 。 
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这 是 一 个 姓 李 的 家 庭 ， 他 们 生活 在 广州 市 
我 是 父亲 一 李 利 海 , 今年 35 岁 。 
我 是 母亲 一 郝 玫 丽 , 今年 33 岁 。 
我 是 儿子 一 李 豪 烨 , 今年 10 岁 。 
父亲 今天 赚 了 229 元 ， 家 庭 资 产 剩余 1229 


母亲 今天 花 了 314 元 ， 家 庭 资 产 剩余 915 
儿子 今天 花 了 75 元 ， 家 庭 资 产 剩余 840 
父亲 告诉 你 一 个 小 秘密 : 我 外 面 有 人 

母亲 告诉 你 一 个 小 秘密 : 我 存 有 很 多 私房 钱 
儿子 告诉 你 一 个 小 秘密 : 我 喜欢 隔离 的 小 花 


图 6-4 家 庭 信 4 顺 壁 


6.5 ”本 章 小 结 


类 是 对 象 的 一 个 具体 描述 ， 对 象 的 属性 和 方法 都 是 通过 类 进行 定义 和 设置 的 。 类 主要 
分 为 属性 和 方法 ， 属 性 就 好 比如 入 的 姓名 、 性 别 和 学 历 等 ， 用 于 对 人 的 描述 ; 方法 就 如 人 


的 四 肢 和 五 官 ， 可 以 实现 某 些 简单 的 操作 。 


类 的 定义 由 关键 词 class 实 现 ， 关 键 词 lass 后 面 为 类 名 ， 这 个 可 以 自 定 义 命 名 ;类 名 后 


典 类 在 日 常 开 发 中 不 建议 使 用 ， 现 在 都 是 使 用 新 式 类 进行 定义 。 


量 公 


[ 
只 能 在 类 的 内 部 使 用 ， 无 法 在 类 的 外 部 调用 ， 这 是 类 的 第 二 层 封装 。 
继承 常用 于 父母 与 子女 之 间 ， 比 如 子女 的 外 貌 长 得 像 父母 ， 这 是 因为 子女 的 基因 来 


面 是 一 个 小 括号 和 object 类 ， 这 是 Python 的 新 式 类 。Python 的 类 分 为 新 式 类 和 经 典 类 ， 经 


Python 的 类 可 以 分 成 两 层 的 封装 ， 类 在 实例 化 时 所 生成 的 对 象 可 看 作 一 个 已 经 封装 好 
对 象 ， 调 用 对 象 的 属性 或 方法 来 实现 某 些 功能 ， 这 是 类 的 第 一 层 封装 。 有 时 候 需 要 把 类 
面 的 某 些 属性 或 方法 封装 起 来 ， 将 其 设置 为 类 的 私有 属性 或 方法 ， 使 得 这 些 属性 和 方法 


自 


于 父母 。 编 程 语言 中 的 继承 也 是 如 此 ， 比 如 在 定义 Student 类 的 时 候 ， 可 以 使 Student 类 继 


承 Person 类 ， 使 得 子 类 Student 拥有 父 类 Person 的 所 有 属性 和 方法 ， 而 且 子 类 Student 可 重 


写 父 类 的 属性 和 方法 或 自 定义 新 的 属性 和 方法 。 


异常 机 制 


本 章 讲述 Python 的 异常 机 制 ， 包 括 : 异常 概念 与 类 型 、 捕 捉 异 常 以 及 自 定义 异常 。 异 
常 概 念 与 类 型 是 解读 Python 的 异常 信息 和 列举 内 置 异 常 类 ， 通 过 异常 信息 找 出 对 应 的 异常 
类 ; 捕捉 异常 是 在 代码 里 设置 异常 机 制 ， 代 码 运行 中 出 现 异 常 可 进行 捕捉 和 处 理 ; 自 定义 
异常 是 在 继承 异常 类 的 基础 上 进行 定义 ， 并 自行 抛 出 异常 类 ， 从 而 控制 程序 的 运行 逻辑 。 


7.1 了 解 异常 


异常 机 制 是 指 对 程序 运行 过 程 中 出 现 错误 而 进行 处 理 操作 ， 一 般 情况 下 ， 程 序 在 运行 
中 出 现 错误 会 停止 运行 并 发 送 错误 信息 ， 倘 若 在 程序 中 加 入 异常 机 制 ， 当 程序 运行 中 出 现 
潍 误 的 时 候 ， 它 会 捕捉 错误 信息 并 执行 相应 的 处 理 ， 这 样 能 使 程序 继续 保持 运行 状态 。 

想 要 了 解 Python 的 异常 机 制 ， 首 先 要 了 解 异 常 的 定义 及 一 些 常见 的 异常 。 异 常 是 程序 
在 执行 过 程 中 出 现 问 题 而 导致 程序 无 法 执行 ， 如 程序 的 逻辑 或 算法 错误 、 计 算 机 的 资源 不 
足 或 IO 错误 等 。 不 管 哪 一 种 异常 ， 只 要 程序 在 运行 中 出 现 错误 都 可 认为 是 异常 ， 并 且 抛 出 
异常 信息 ， 我 们 可 以 根据 异常 信息 了 解 异常 的 具体 信息 ， 如 图 7-1 所 示 。 
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Traceback (most recent call last) : 


File “F:/aa.py”, line 2, in 《module> 


s = Student( Lucy’) 


NameError: name "Student”is not defined 


图 7-1 异常 信息 


从 异常 信息 可 以 看 到 ，Traceback 是 异常 跟踪 的 信息 ， 从 File "F:/aapy", line 2 得 知 ， 在 
aa.py 文件 里 的 第 二 行 代码 出 现 错误 ; s = Student(Lucy') 是 程序 错误 的 具体 位 置 。 最 后 一 行 
的 错误 信息 是 这 个 异常 的 错误 类 型 及 说 明 错误 原因 的 提示 信息 : NameError 是 错误 类 型 
name 'Student is not defined 是 错误 原因 ， 这 个 错误 原因 是 指 代码 中 的 Student 没有 定义 。 

Python 的 异常 是 由 类 定义 的 ， 所 有 的 异常 都 来 自 于 BaseException 类 ， 不 同类 型 的 异常 
都 继承 自 父 类 BaseException， 有 具体 的 结构 如 图 7-2 所 示 。 


Keyboardlnterrupt xceptio SystemExit 


NameError、ValueError 


图 7-2 异常 类 的 结构 
从 图 上 可 以 看 到 ，BaseException 的 子 类 有 KeyboardInterrupt 、 Exception 和 
SystemExit， 而 所 有 的 异常 都 是 由 子 类 Exception 定义 和 描述 ， 这 里 以 表格 的 形式 列 出 一 些 
常见 的 异常 ， 如 表 7-1 所 示 。 


表 7-1 Python 的 异常 类 


异常 类 说 明 

AttributeError 访问 一 个 对 象 没有 的 属性 ， 比 如 foo.x， 但 是 foo 没有 属性 x 
IOError 输入 /输出 异常 ， 如 无 法 打开 文件 

ImportError 无 法 引入 模块 或 包 ， 通 常 是 路 径 问题 或 名 称 错误 
IndentationError 语法 错误 ， 代 码 没 有 正确 对 齐 
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( 续 表 ) 
异常 类 说 明 
IndexError 下 标 索 引 超出 序列 边界 
KeyError 访问 字典 里 不 存在 的 键 
KeyboardInterrupt 用 户 中 断 执行 
NameError 访问 一 个 没有 申明 的 变量 或 对 象 
SyntaxError 语法 错误 ， 代 码 出 现 错误 
TypeError 传 入 对 象 类 型 与 定义 的 不 符合 
UnboundLocalError 访问 一 个 还 未 被 设置 的 局 部 变量 
ValueError 传 入 无 效 的 参数 或 数值 
UnicodeError 编码 的 相关 错误 
TabError Tab 和 空格 混用 
MemoryError 计算 机 的 内 存 溢出 错误 
OverflowError 数值 运算 超出 最 大 限制 


7.2 捕捉 异常 


相信 读者 对 Python 的 异常 信息 有 一 定 的 了 解 ， 现 在 我 们 使 用 异常 机 制 对 这 些 异 常 进行 
捕捉 并 处 理 。Python 的 异常 机 制 语法 如 下 : 


En 
程序 运行 的 代码 
except NameError as err: 
只 捕捉 NameError 的 错误 类 型 


print (' 错 误 啦 ， 错 误 信 息 是 : '，err) 


except Exception as err: 


捕捉 全 部 的 错误 类 型 
print (' 错 误 啦 ， 错 误 信息 是 : '，err) 
exCept: 
捕捉 全 部 的 错误 类 型 ， 但 没有 错误 信息 
print (' 错 误 啦 ') 
else: 
print (' 如 果 没 有 异常 就 执行 此 处 的 代码 ' ) 
finally: 


print (' 不 管 是 否 有 异常 都 会 执行 此 处 的 代码 ' ) 
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完整 的 异常 机 制 语 法 由 4 个 关键 词组 成 : try、except、else 和 finally。 每 个 关键 词 都 有 
不 同 的 作用 ， 其 中 关键 词 ty 和 except 是 必 不 可 少 的 ，else 和 finally 可 以 根据 实际 需求 来 决 
是 否 添加 。4 个 关键 词 的 具体 说 明 如 下 。 


etry; 用 于 监测 程序 代码 是 否 出 现 异常 ， 监 测 的 代码 可 以 是 程序 的 全 部 代码 或 者 程序 的 
部 分 代码 。 

@ except; 用 于 捕捉 异常 信息 并 对 异常 进行 处 理 ， 若 关键 词 后 面 设置 异常 类 型 ， 在 捕捉 过 
程 中 根据 异常 类 型 而 选择 相应 的 except。 

@ else: 如 果 关 键 词 ty 的 代码 里 面 没有 出 现 异常 ， 程 序 就 会 执行 此 关键 词 里 面 的 代码 。 

e finally: 不 管 关 键 词 ty 是 否 出 现 异常 ， 当 关键 词 tHy、except 或 else 的 代码 执行 完成 后 ， 
最 终 程 序 会 自动 执行 此 关键 词 里 面 的 代码 。 


我 们 通过 一 个 简单 的 例子 来 说 明 如 何 使 用 Python 的 异常 机 制 ， 例 子 代 码 如 下 所 示 : 


3€ name =="' main ': 
有 
s= Student('Lucy') 
pass 


except NameError as err: 
print (' 这 是 NameError 错误 ， 错 误 信息 是 : '，err) 
except Exception as err: 
print (' 这 是 Exception 错误 ， 错 误 信息 是 : '，err) 
else: 
print (' 如 果 没 有 异常 就 执行 此 处 的 代码 ' ) 
finally: 
print (' 不 管 是 否 有 异常 都 会 执行 此 处 的 代码 ' ) 
由 于 Student 是 未 定义 的 变量 或 对 象 ， 因 此 程序 在 执行 过 程 中 会 出 现 NameError 异常 ， 
异常 信息 会 被 except NameError as err 所 捕捉 并 执行 相应 的 处 理 ， 最 后 程序 还 会 执行 关键 词 
finally 里 面 的 代码 。 
若 将 except NameError as err 及 其 代码 删除 或 注释 后 ， 当 程序 中 再 次 出 现 NameError 异 
常 ， 它 会 被 except Exception as err 所 捕捉 并 处 理 。 这 说 明 在 一 个 异常 机 制 中 ， 如 果 设置 多 
个 关键 词 except， 当 出 现 异常 的 时 候 ， 异 常 捕捉 是 从 上 至 下 执行 ， 只 要 符合 其 中 一 个 捕捉 
条 件 ， 程 序 就 会 执行 该 except 里 面 的 代码 。 
此 外 ， 一 个 异常 机 制 可 以 支持 多 个 异常 机 制 的 嵌 套 ， 但 嵌 套 过 多 会 使 代码 结构 变 得 相 
当 复 杂 ， 不 利于 维护 和 了 阅读。 异常 机 制 的 嵌 套 如 下 所 示 : 


84 | Python 自动 化 开发 实战 


3 name == "' main 
5 = Student('Lucy') 
except Exception as err: 

计生 
print (' 这 是 第 一 个 Exception 错误 ， 错 误 信息 是 : '，err) 
s= Student('Lucy') 

except Exception as error: 
print (' 这 是 第 二 个 Exception 错误 ,错误 信息 是 : '，err) 


7.3” 自 定义 异常 


异常 一 般 是 由 程序 在 运行 过 程 中 遇 到 错误 的 时 候 而 生成 的 ， 但 有 时 候 我 们 也 需要 自己 
抛 出 一 些 异 常 信息 ， 让 程序 去 捕捉 和 处 理 。 自 定义 异常 抛 出 除了 监测 错误 之 外 ， 还 可 以 用 
于 代码 的 布局 设计 和 程序 的 逻辑 控制 ， 通 过 抛 出 异常 可 以 执行 不 同 的 代码 块 。 自 定义 异常 
抛 出 由 关键 词 raise 实现 ， 关 键 词 后 面 填写 异常 的 类 型 及 异常 信息 ， 上 有 具体 示 例如 下 : 


4£ name == "' main ': 


CE 
raise NameError(' 自 定义 异常 抛 出 ') 
except Exception as err: 
print (' 这 是 Exception 错误 ， 错 误 信息 是 : '，err) 

上 述 示例 是 我 们 主动 抛 出 NameError 异 常 ，NameError 是 已 定义 好 的 异常 类 。 如 果 在 自 
定义 异常 抛 出 或 异常 捕捉 的 时 候 不 想 使 用 Python 内 置 的 异常 类 ， 可 以 自 定义 一 个 异常 类 ， 
只 要 将 自 定义 异常 类 继承 Exception 类 即 可 。 在 自 定义 抛 出 异常 或 异常 捕捉 的 时 候 ， 在 关键 
词 raise 或 except 后 面 写 上 自 定义 异常 类 型 即 可 ， 具 体 示例 代码 如 下 : 

# 自 定义 异常 类 型 


class MyError (Exception): 


pass 
eb name == " main ': 
EP 
抛 出 自 定义 异常 


raise MyError(' 自 定义 异常 抛 出 ') 
丰 捕捉 自 定义 异常 类 
except MyError as err: 
print (' 这 是 MyError 错误 ， 错 误 信息 是 : '，err) 
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在 自 定 义 异 常 类 MyError 中 ， 代 码 中 的 pass 是 一 个 空 语 句 ， 这 是 为 了 保持 程序 结构 的 
完整 性 ， 它 不 会 做 任何 事情 ， 只 用 于 占 位 。 


7.4 


实战 ， 编 写 “ 角 色 扮 演 ” 游 戏 


狼人 游戏 是 比较 流行 的 桌 上 游戏 ， 游 戏 中 主要 由 狼人 、 特 殊 村 民 和 普通 村 民 组 成 ， 狼 
人 的 目标 是 吞食 所 有 村 民 ， 而 村 民 的 目标 则 是 找 出 隐藏 在 村 民 中 的 狼人 并 消灭 他 们 。 整 个 


游戏 的 实质 就 是 通过 


些 线索 去 猜测 推理 每 个 人 的 真实 身份 ， 根 据 这 个 游戏 本 质 ， 我 们 将 


游戏 的 规则 进行 细微 的 调整 。 具 体 的 游戏 设计 说 明 如 下 : 


〈1) 目 

(2) 定义 玩家 与 角色 ， 并 将 两 者 随机 

(3) 每 个 玩家 只 能 对 其 身份 进行 两 次 猜测 ， 
结束 。 


定义 两 个 异常 类 ， 以 控制 角色 猜测 的 错误 次 数 和 判断 胜利 的 条 件 。 


匹配 ， 使 得 每 一 次 游戏 的 玩家 角色 不 会 重复 。 


总 错误 次 数 不 能 超过 5 次 ， 否 则 游戏 


(4) 如 果 每 个 玩家 的 身份 都 猜 对 了 ， 则 游戏 胜利 。 
根据 上 述 设 定 的 游戏 规则 ， 编 写 游戏 的 功能 代码 ， 如 下 所 示 : 


import random 

# 自 定义 异常 类 

class MuchError (Exception): 
pass 

class Victory (Exception): 


pass 
# 定义 玩家 与 角色 
player = [' 小 黄 '，' 小 黑 '，' 小 白 '，' 小 红 '] 
FOTe = 六 太 和 人 和 0 村 民 人 中 
i Ek :| 


# 将 玩家 与 角色 的 顺序 打 乱 并 匹配 


player = random.sample (player, 


role = random.sample (role, 
Print (' 游 戏 中 全 部 身份 有 : ' + '、 
matching = {} 

for t in range(len(player)): 


matching[player[t]] = role[t] 


len (player)) 
len (player)) 


'.join(role)) 


86 | Python 自动 化 开发 实战 


# 游戏 逻辑 
Ery 
result, err = 0, 0 
for t in player: 
for i in range(2): 
guess = input (' 你 认为 ' + 七 + ' 的 身份 是 : ') 
if guess == matching[t]: 
resulE + 
print (' 你 猜 对 了 ') 
break 
else: 
r= 
Print (' 猜 错 了 ， 你 还 有 '+ str (1-i) +' 次 机 会 ') 
PC SS5 


raise MuchError(' 错 误 次 数 已 超出 5 次 ， 游 戏 结束 ' ) 


if result == len (player): 


raise Victory(' 共 喜人 你 ， 全 部 猜 对 了 ') 


except MuchError as errInfo: 
print (errInfo) 


整 段 代码 主要 分 为 3 部 分 ， 自 定义 异常 类 、 玩 家 与 角色 设 定 与 匹配 和 游戏 逻辑 。 其 中 
游戏 逻辑 是 整个 游戏 的 核心 代码 ， 它 是 在 一 个 try…except 机 制 里 完成 ， 具 体 说 明 如 下 : 


(1) 首先 将 每 位 玩家 进行 循环 遍历 ， 保 证 每 位 玩家 都 可 以 进行 身份 猜测 。 

(2) 然后 对 每 位 玩家 再 循环 两 次 ， 代 表 每 位 玩家 的 身份 有 两 次 猜测 机 会 ， 每 循环 一 次 
都 会 执行 下 …else 判断， 判断 猜测 结果 是 否 正 确 。 

(3) 最 后 分 别 判断 错误 次 数 err 和 正确 次 数 result。 如 果 错 误 次 数 大 于 5， 抛 出 自 定义 
异常 MuchError， 直 接 终止 try 里 面 的 所 有 for 循环 ， 并 控制 程序 执行 。 如 果 正 确 次 数 等 于 
4， 也 就 是 全 部 玩家 的 身份 都 猜测 正确 了 ， 就 会 抛 出 自 定义 Victory 异常 。 


7.5 ”本 章 小 结 


异常 机 制 是 对 程序 运行 过 程 中 出 现 错误 而 进行 处 理 操作 ， 一 般 情况 下 ， 程 序 在 运行 中 
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误 的 时 候 ， 它 会 捕捉 错误 信息 并 执行 相应 的 处 理 ， 这 样 能 使 程序 继续 保持 运行 状态 。 
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出 现 错 误会 停止 运行 并 发 送 错误 信息 ， 倘 若 在 程序 中 加 入 异常 机 制 ， 当 程序 运行 中 出 现 错 


完整 的 异常 机 制 语 法 由 4 个 关键 词组 成 : try、except、else 和 finally。 每 个 关键 词 都 有 
不 同 的 作用 ， 其 中 关键 词 try 和 except 是 必 不 可 少 的 ，else 和 finally 可 以 根据 实际 需求 来 决 


定 是 否 添加 。4 个 关键 词 的 具体 说 明 如 下 。 


@ try: 用 于 监测 程序 代码 是 否 出 现 异常 ， 监 测 的 代码 可 以 是 程序 的 全 部 代码 或 者 程序 的 


部 分 代码 。 


@ ”except: 用 于 捕捉 异常 信息 并 对 异常 进行 处 理 ， 若 关键 词 后 面 设置 异常 类 型 ， 在 捕捉 过 


程 中 根据 异常 类 型 而 选择 相应 的 except。 


@ else: 如 果 关 键 词 ty 的 代码 里 面 没有 出 现 异常 ， 程 序 就 会 执行 此 关键 词 里 面 的 代码 。 
e@ finally: 不 管 关键 词 ty 是 否 出 现 异 常 ， 当 关键 词 ty、except 或 else 的 代码 执行 完成 后 ， 


最 终 程序 会 自动 执行 此 关键 词 里 面 的 代码 。 


异常 一 般 是 由 程序 在 运行 过 程 中 遇 到 错误 的 时 候 而 生成 的 ， 但 有 时 候 我 们 需要 
出 一 些 异 常 信息 ， 让 程序 去 捕捉 和 处 理 此 类 异常 ， 称 为 自 定义 异常 。 自 定义 异常 除了 
错误 之 外 ， 还 可 以 用 于 代码 的 布局 设计 和 程序 的 逻辑 控制 ， 通 过 抛 出 异常 可 以 执行 不 


代码 块 。 自 定义 异常 抛 出 由 关键 词 raise 实现 ， 关 键 词 后 面 是 填写 异常 的 类 型 及 异常 信 ， 


己 抛 


监测 


同 的 
息 


如 果 在 自 定 义 异 常 抛 出 或 异常 捕捉 的 时 候 不 想 使 用 Python 内 置 的 异常 类 ， 也 可 以 


在 


义 一 个 异常 类 ， 只 要 使 自 定义 异常 类 继承 Exception 类 即 可 。 


本 章 讲述 如 何在 Python 中 使 用 Selenium 实现 网 页 自动 化 开发 ， 主 要 介绍 Selenium 的 概 
念 、 开 发 环境 搭建 、Selenium 模拟 用 户 打 开 浏 览 器 并 实现 自动 操控 浏览 器 的 网 页 ， 如 单 
击 、 鼠 标 拖拉 和 文本 输入 等 操作 。 


8.1 了 解 Selenium 


Selenium 是 一 个 用 于 网 站 应 用 程序 自动 化 的 工具 。 它 可 以 直接 运行 在 浏览 器 中 ， 就 像 
真正 的 用 户 在 操作 一 样 。 它 支持 的 浏览 器 包括 下 、Mozilla Firefox、Safari、Google Chrome 
和 Opera 等 ， 同 时 支持 多 种 编程 语言 ， 如 .Net、Java、Python 和 Ruby 等 。 

Jason Huggins 在 2004 年 发 起 了 Selenium 项 目 ， 这 个 项 目 主要 是 为 了 不 想 让 自己 的 时 间 
浪费 在 无 聊 的 重复 性 工作 中 。 因 当时 测试 的 浏览 器 都 支持 JavaScript，Jason 和 他 所 在 的 团 
队 就 采用 JavaScript 编写 了 一 种 测试 工具 一 一 JavaScript 类 库 ， 来 验证 浏览 器 页 面 的 行为 。 
这 个 JavaScript 类 库 就 是 Selenium core， 同 时 也 是 seleniumRC、Selenium IDE 的 核心 组 件 ， 
Selenium 由 此 诞生 。 

从 Selenium 诞生 至 今 一 共 发 展 了 3 个 版 本 : Selenium 1.0、Selenium 2.0 和 Selenium 
3.0。 每 个 版 本 的 更 新 都 有 一 些 变化 ， 下 面 大 概 了 解 一 下 各 个 版 本 的 信息 : 


第 8 章 网 页 自动 化 开发 | 89 


@ Selenium 1.0: 主要 由 Selenium IDE、Selenium Grid 和 Selenium RC 组 成 。Selenium IDE 
是 说 入 到 浏览 器 的 一 个 插件 ， 由 于 实现 简单 的 浏览 器 操作 的 录制 与 回放 功能 
Selenium Grid 是 一 种 自动 化 的 辅助 工具 ， 通 过 利用 现 有 的 计算 机 基础 设施 ， 能 加 快 网 
站 自动 化 操作 ; Selenium RC 是 Selenium 家 族 的 核心 部 分 ， 支 持 多 种 不 同 开 发 语言 编写 的 
自动 化 脚本 ， 通 过 Selenium RC 的 服务 器 作为 代理 服务 器 去 访问 网 站 应 用 ， 从 而 达到 自动 
化 目的 。 

@ Selenium 2.0: 该 版 本 在 1.0 版 本 的 基础 上 结合 了 Webdriver。Selenium 通 过 Webdriver 直 
接 操控 网 站 应 用 ， 解 决 了 Selenium 1.0 存 在 的 缺点 。WebDriver 针 对 各 个 浏览 器 而 开 
发 ， 取 代 了 网 站 应 用 的 JavaScript。 目 前 大 部 分 自动 化 技术 都 是 以 Selenium 2.0 为 主 ， 这 
也 是 本 书 主要 讲述 的 内 容 。 

e@ Selenium 3.0: 这 个 版 本 做 了 不 大 不 小 的 更 新 。 如 果 是 使 用 Java 开 发 只 能 在 Java 8 以 上 的 
开发 环境 ， 如 果 以 IE 浏览 器 作为 自动 化 浏览 器 ， 浏 览 器 必须 在 IE 9 版 本 或 以 上 。 


从 Selenium 的 各 个 版 本 信息 可 以 了 解 到 ， 它 必须 在 浏览 器 的 基础 上 才能 实现 自动 化 。 
目前 浏览 器 的 种 类 繁多 ， 比 如 搜狗 浏览 器 、QQ 浏览 器 和 百度 浏览 器 等 ， 这 些 浏览 器 大 多 
数 是 在 正 内 核 、Webkit 内 核 或 Gecko 内核 的 基础 上 开发 而 成 的 。 为 了 统一 浏览 器 的 使 用 ， 
Selenium 主要 支持 下 、Mozilla Firefox、Safari、Google Chrome 和 Opera 等 主流 浏览 器 。 

Selenium 发 展 至 今 ， 不 仅 在 自动 化 测试 和 自动 化 流程 开发 的 领域 上 占据 着 重要 的 位 
置 ， 而 且 在 网 络 疏 虫 上 也 被 广泛 使 用 。 


8.2 ”安装 Selenium 


由 于 Selenium 支持 多 种 浏览 器 ， 本 书 以 Google Chrome 作为 讲述 对 象 。 搭 建 Selenium 
开发 环境 需要 安装 Selenium 库 并 且 配 置 Google Chrome 的 WebDriver。 安 装 Selenium 库 可 
以 使 用 pip 指令 完成 ， 具 体 的 安装 指令 如 下 : 


pip install selenium 


Selenium 安装 完成 后 ， 我 们 在 CMD 环境 下 验证 Selenium 是 否 安装 成 功 。 在 CMD 里 输 
入 “python” 并 按 回 车 ， 就 会 进入 Python 的 交互 模式 。 在 交互 模式 下 依次 输入 以 下 代码 : 


>>> import selenium 
>>> selenium. version | 
本 
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从 上 述 代码 可 知 ， 在 Python 的 交互 模式 下 成 功 地 导入 了 Selenium 库 ， 并 且 当 前 


Selenium 


库 的 版 本 信息 为 3.14.0。Selenium 的 安装 相对 较为 简单 ， 接 下 来 安装 Google Chrome 的 


WebDriver。 首 先 打 开 Google Chrome 并 查看 当前 的 版 本 信息 , 在 浏览 器 中 找到 “ 


I 


制 Google Chrome” 一 “帮助 (E)” 一 “关于 Google Chrome(G)” 按 钮 ， 如 图 8-1 所 示 。 


关于 Google Chrome(G) 


打开 新 的 标签 页 (T) tr 
打开 新 的 窗口 (N) Ctri+h 
打开 新 的 无 站 窗口 由 CtrlySshift+N 


历史 记录 (H) 


更 多 工具 (D 
修改 剪 切 (D 复制 (C) 粘贴 (P) 


设置 (5) 


退出 多 CtrlyShift+( 


浏览 器 版 本 查看 方法 


除了 上 述 方法 之 外 ， 还 可 以 在 浏览 器 的 地 址 栏 上 直接 输入 chrome://settings/help 并 按 回 


© Google Chrome 


从 图 


车 即 可 查看 浏览 器 的 版 本 信息 。 版 本 信息 如 图 8-2 所 示 。 


检查 更 新 时 出 错 : 无 法 启动 更 新 检查 (错误 代码 为 3: 0x80040154) 。 
7 解 详情 


图 8-2 浏览 器 版 本 信息 


6-2 中 可 以 得 知 ， 当 前 Google Chrome 的 版 本 为 68， 根 据 版 本 信息 找到 与 之 对 应 


的 WebDriver 版 本 。Google Chrome 与 WebDriver 版 本 对 照 表 如 表 8-1 所 示 。 
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表 8-1 Google Chrome 与 WebDriver 版 本 对 照 表 
chromedriver 版 本 (WebDriver) Google Chrome 版 本 


V2.40 V66-68 
V2.39 V66-68 
V2.38 v65-67 
v2.37 V64-66 
v2.36 V63-65 
V2.35 V62-64 
V2.34 v61-63 
V2.33 v60-62 
V2.32 V59-61 
v2.31 v58-60 


根据 浏览 器 的 版 本 号 与 对 照 表 可 以 知道 ，chromedriver (WebDriver) 版 本 号 应 为 v2.40 
或 v2.39。 在 浏览 器 上 访问 http://npm.taobao.org/mirrors/chromedriver/ 并 找到 v2.40 所 在 位 置 ， 
进入 v2.40 并 单 击 chromedriver win32.zip 的 下 载 链接 。 把 下 载 的 chromedriver win32.zip 进行 
， 如 图 8-3 所 示 。 


5ab) on port 


图 8-3 ”chromedriver 的 版 本 信息 


确认 chromedriver 的 版 本 信息 无 误 之 后 ， 我 们 将 chromedriver.exe 直接 放置 在 Python 的 
安装 目录 ， 比 如 本 书 的 Python 安装 目录 在 E:\Python， 如 图 8-4 所 示 。 


应 用 程序 工具 ”Python 
管理 
~ 个 在 > 此 电脑 > 软件 (E) > Python 
全 名称 


对 快速 访问 


selenium 


和 和 上 而 td 
各 下 载 + § Tools 


嫩 文档 + EE chromedriver.exe 


起 图 片 才 1 LICENSE.txt 
时 此 电脑 过 v NEWS.txt 


29 个 项 目 选中 1 个 项 目 6.16 MB 


图 8-4 chromedriver.exe 存放 位 置 
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完成 Selenium 库 的 安装 以 及 chromedriver 的 配置 后 ， 在 PyCharm 里 创建 一 个 testpy 文 
编写 以 下 代码 来 验证 Selenium 是 否 能 自动 启动 并 控制 Google Chrome。 代 码 如 下 : 


# 导入 Selenium 的 webdriver 类 

from selenium import webdriver 

# 设置 变量 url， 用 于 浏览 器 访问 

Url = 'https://www.baidu.com/' 

# 将 webdriver 类 实例 化 ， 将 浏览 器 设 定 为 coogle Chrome 
# 参数 executable _ path 是 设置 chromedriver 的 路 径 
path = 'E:\\Python\\chromedriver.exe' 


性 


browser = webdriver.Chrome (executable path=path) 
# 打开 浏览 器 并 访问 百度 网 址 


browser.get (url) 


上 述 代码 分 为 三 个 步骤 : 导入 Selenium 库 的 webdriver 类 、webdriver 类 实例 化 并 指定 
浏览 器 、 打 开 浏览 器 访问 网 址 。 注 意 , 如 果 chromedriver.exe 存放 在 Python 的 安装 目录 ， 在 
webdriver 类 实例 化 的 时 候 ， 无 需 设 置 参数 executable_path; 但 chromedriver.exe 存放 在 其 他 
目录 ， 在 实例 化 的 时 候 要 设置 参数 executable_ path 来 指向 chromedriver.exe 所 在 的 位 置 。 上 
述 代码 运行 后 ， 程 序 会 自动 打开 一 个 新 的 Google Chrome， 如 图 8-5 所 示 。 


党 百度 一 下 ,你 就 知道 x Ot 


€ C @ https//www.baidu.com 


Chrome 正 受到 自动 测试 软件 的 控制 。 


图 8-5 Selenium 控制 Google Chrome 


此 外 ，Selenium 还 可 以 控制 其 他 浏览 器 ， 在 执行 程序 之 前 ， 记 得 配置 浏览 器 的 
WebDriver， 配 置 方法 与 配置 Google Chrome 的 大 同 小 异 。 首 先 通 过 浏览 器 版 本 确认 
WebDriver 的 版 本 ， 然 后 下 载 WebDriver 并 存放 在 Python 的 安装 目录 。 以 下 和 Mozilla 
Firefox 为 例 ， 两 者 的 WebDriver 配置 过 程 就 不 作 详细 讲述 ， 此 处 只 列 出 Selenium 的 具体 代 
码 ， 如 下 所 示 : 

启动 火狐 浏览 器 

from selenium import webdriver 

browser = webdriver-Firefox() 


browser.get ('http://www.baidu.com/') 


# 启动 IE 浏览 器 
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from selenium import webdriver 
browser = webdriver.Ie() 


browser.get ('http://www.baidu.com/') 


8.3 浏览 器 查找 元 素 


在 上 一 节 中 已 经 部 署 了 Selenium+chromedriver 的 开发 环境 ， 在 真正 的 开发 之 前 ， 还 需 
要 学 会 利用 浏览 器 来 查找 网 页 元 素 。 因 为 Selenium 是 通过 程序 来 自动 操控 网 页 的 控件 元 
素 ， 比 如 单 击 某 个 按钮 、 输 入 文本 框 内 容 等 ， 若 网 页 中 有 多 个 同类 型 的 元 素 ， 好 比 有 多 个 
按钮 ， 想 要 Selenium 精准 地 单 击 目标 元 素 ， 需 要 将 目标 元 素 的 具体 信息 告知 Selenium， 让 
它 根据 这 些 信 息 在 网 页 上 找到 该 元 素 并 进行 操控 。 

网 页 的 元 素 信 息 是 通过 浏览 器 的 开发 者 工具 来 获取 。 以 Google Chrome 为 例 ， 在 浏览 
器 上 访问 豆 办 电影 网 https:/movie.douban.com/)， 然 后 按 快 捷 键 F12 打开 Chrome 的 开发 者 
工具 ， 如 图 8-6 所 示 。 


(Em x 


€ CG | @ 安全 | https//movie.douban.com 


豆瓣 电 影 


影讯 8 购 票 。 选 电影 电视剧 排行 榜 分 类 “影评 2017 年 度 榜 单 。 ”2017 观 影 报告 


民 所 Elements 


图 8-6 网 页 信息 


从 图 8-6 中 可 以 看 到 ， 开 发 者 工具 的 界面 共有 9 个 标签 页 ， 分 别 是 Elements、 
Console、Sources、Network、Performance、Memory、Application、Security 和 Audits。 开 
发 者 工具 以 Web 开发 调试 为 主 ， 如 果 只 是 获取 网 页 元 素 信 息 ， 只 需 熟练 掌握 Elements 标签 
页 即 可 。 
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Elements 标签 页 允许 从 浏览 器 的 角度 查看 页 面 ， 也 就 是 说 , 可 以 看 到 Chrome 演 染 页 面 


Python 自动 化 开发 实战 


所 需要 的 HIML、CSS 和 DOM (Document Object Model) 对 象 。 此 外 ， 还 可 以 编辑 内 容 更 


改 页 面 


CSS 布 


HIML 


显示 效果 。 它 一 共 分 为 两 部 分 ， 左 边 是 当前 网 页 的 HIML 内 容 ， 右 边 是 某 个 元 素 的 


局 内 容 。 查 找 元 素 信息 以 左边 的 HTML 内 容 为 主 ， 在 查找 控件 信息 之 前 ， 首 先 了 解 


的 相关 知识 。 


HIML 是 超 文本 标记 语言 ， 这 是 标准 通用 标记 语言 下 的 一 个 应 用 。“ 超 文本 ”就 是 指 
页 面 内 可 以 包含 图 片 、 链 接 ， 甚 至 音乐 、 程 序 等 非 文 字 元 素 。 超 文本 标记 语言 的 结构 包括 


“ 头 ” 部 分 (Head) 和 “主体 ”部 分 (Body) ， 其 中 “ 头 ” 部 分 提供 关于 网 页 的 信息 ，“ 主 


体 ” 部 分 提供 网 页 的 具体 内 容 。 通 过 一 个 简单 HTML 来 进一步 了 解 : 


# 声明 为 HTML5 文档 

<!DOCTYPE html> 

# 元 素 是 HTML 页 面 的 根 元 素 
<html> 

# 元 素 包 含 了 文档 的 元 (meta) 数据 
<head> 

# 提供 页 面 的 元 信息 ， 主 要 是 描述 和 关键 词 
<meta charset="utf-8"> 

# 元 素描 述 了 文档 的 标题 
<title>Python</title> 
</head> 

# 元 素 包 含 了 可 见 的 页 面 内 容 
<body> 

# 定义 一 个 标题 

<h1> 我 的 第 一 个 标题 </h1> 

# 元 素 定义 一 个 段落 

<p> 我 的 第 一 个 段落 。</p> 
</body> 

</html> 


一 个 完整 的 网 页 必定 以 <html></html> 为 开头 和 结尾 ， 整 个 HTML 可 分 为 两 部 分 : 


(1) <head></head> 是 对 网 页 的 描述 、 图 片 和 JavaScript 的 引用 。<head> 元 素 包含 所 
有 的 头 部 标签 元 素 。 在 <head> 元 素 中 可 以 插入 脚本 〈scripts) 、 样 式 文件 (CSS) 及 各 种 
meta 信息 。 该 区 域 可 添加 的 元 素 标签 有 <title>、<style>、<meta>、<link>、<script>、 
<noscript> 和 <base>。 

(2) <body></body> 是 网 页 信息 的 主要 载体 。 该 标签 下 还 可 以 包含 很 多 类 别 的 标签 ， 
不 同 的 标签 有 不 同 的 作用 。 每 个 标签 都 是 以 心 开头 ， 以 < 人 结尾 ， 定 和 </> 之 间 的 内 容 是 标 
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签 的 值 和 属性 ， 每 个 标签 之 间 可 以 是 相互 独立 的 ， 也 可 以 是 嵌 套 、 层 层 递 进 的 关系 。 


根据 这 两 个 组 成 部 分 就 能 很 容易 地 分 析 整 个 网 页 的 布局 。 其 中 ，<body></body> 是 整 
个 HTML 的 重点 部 分 ， 通 过 示例 讲述 如 何 分 析 <body></body>: 


<body> 

<h1> 我 的 第 一 个 标题 </h1> 
<div> 
<p>Python</p> 
</div> 

<h2> 

<p> 
<a>Python</a> 
</p> 

</h2> 

</body> 


上 述 例子 主要 讲述 “主体 ”部 分 (Body) 的 使 用 方式 ， 我 们 对 代码 进行 详细 分 析 ， 说 
明 如 下 : 


(1) <hl>、<div> 和 <h2> 是 互 不 相关 的 标签 ， 三 个 标签 之 间 是 相互 独立 的 。 

(2) <div> 标 签 和 <div> 里 面 的 <p> 标 签 是 嵌 套 关系 ，<p> 的 上 一 级 标签 是 <div>。 

(3) <hl> 和 <p> 是 两 个 毫 无 关系 的 标签 。 

(4) <h2> 标 签 包 含 一 个 <p> 标 签 ，<p> 标 签 再 包含 一 个 <a> 标 签 ， 一 个 标签 可 以 岂 套 多 
个 标签 。 


除 上 述 示例 的 标签 之 外 ， 大 部 分 标签 都 可 以 在 <body></body> 中 使 用 ， 常 
表 8-2 所 示 。 


的 标签 如 


表 8-2 HTML 的 常用 标签 
HTML 标签 中 文 释义 


<img> 图 片 ， 用 于 显示 图 片 

<a></a> 锚 ， 在 网 页 中 设置 其 他 网 址 链接 
<strong></strong> 加 重 (文本 )， 文 本 格式 之 一 
<em></em> 强调 (文本 )， 文 本 格式 之 一 
<i></ 放 > 斜体 字 ， 文 本 格式 之 一 
<b></b> 粗 体 (文本 )， 文 本 格式 之 一 
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( 续 表 ) 
HTML 标签 中 文 释义 
<br> 插入 简单 的 换行 符 
<div></div> 分 隔 ， 块 级 元 素 或 内 联 元 素 
<span></span> 范围 ， 用 来 组 合 文档 中 的 行内 元 素 
<ol></ol> 有 序列 表 
<ul></ul> 无 序列 表 
<li></li> 列表 项 目 
<dl></dl> 定义 列表 
<hl></hl> 到 <h6></h6> 标题 1 到 标题 6 
<p></p> 定义 段落 
<table></table> 创建 表格 
<tr></tr> 表格 中 的 一 行 
<th></th> 表格 中 的 表 头 
<td></td> 表格 中 的 一 个 单元 格 


大 致 了 解 了 HTML 的 结构 组 成 ， 接 下 来 使 用 开发 者 工具 来 查找 网 页 元 素 。 比 如 查找 豆 
办 电影 网 的 搜索 框 在 HTML 里 所 在 的 位 置 ， 我 们 可 以 单 击 开发 者 工具 的 区 按钮， 然后 将 鼠 
标 移 到 网 页 上 的 搜索 框 并 单 击 ， 最 后 在 Elements 标签 页 里 自动 显示 搜索 框 在 HTML 里 的 元 


素 信息 ， 具 体操 作 如 图 8-7 所 示 。 


了 国 sme x 


二 CC a 安全 | https//movie doubancom 


搜索 电影 、 电 视 剧 、 综 


选 电 影 排行 榜 ”分 类 影评 


Elements 人 ources Network 


grr ne ry 
rediv class="nav-logo 
vediv class-"nav-search 


html body #db-nav-movie div div divnav-search 


Performance 


form fieldset divinp 


2017 年 度 榜 单 2017 观 影 报告 


Memory Application Security Audits A24 


~ Styles Computed EventListeners » 
Ri :hov .cls 
nav-search .inp input { bundle.css:19 


background: » Dsfff; 
width: 96%; 


height: 30px; 
padding-left: 


input¥inp-query 


图 8-7 查找 网 页 元 素 
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从 图 上 可 以 看 到 ， 网 页 中 的 搜索 框 是 由 <input> 标 签 生成 的 ， 该 标签 的 上 一 级 标 


9 


晶 . 


<div>。<input> 标 签 有 属性 id、name、size 和 maxlength 等 ， 这 些 属 性 值 是 这 个 <input> 标 签 特 
有 的 ， 我 们 可 以 通过 这 些 属性 值 来 告诉 Selenium， 让 它 根据 这 些 属性 值 去 操控 这 个 搜索 框 。 


8.4 Selenium 定位 元 素 


上 一 节 我 们 学 会 了 如 何 使 用 浏览 器 来 查找 网 页 元 素 ， 本 节 主 要 讲述 如 何 将 网 页 元 素 告 
知 Selenium， 并 让 它 自 动 操控 网 页 。Selenium 定位 网 页 元 素 主 要 是 通过 元 素 的 属性 值 或 者 


元 素 在 HTML 里 的 路 径 位 置 ， 定 位 方式 一 共有 8 种 ， 如 下 所 示 : 
# 通过 属性 id 和 name 来 实现 定位 


find element by id() 
find element by name () 


通过 HTML 标签 类 型 和 属性 class 实现 定位 
find element by class name() 
find element by tag name() 


通过 标签 值 实现 定位 ，partial_1ink 用 于 模糊 匹配 。 
find element by link text() 
find element by partial link text() 


元 素 的 路 径 定位 选择 器 
find element by xpath() 
find element _by_css_selector 1() 


我 们 将 8 种 定位 方式 分 为 4 组 ， 分 组 标准 是 以 每 种 定位 方式 的 优 缺 点 来 进行 划分 
体 的 说 明 如 下 : 


(1) find_ element by id 和 find_element by_name 分 别 通过 元 素 属性 id 和 name 的 
值 来 定位 。 如 果 被 定位 的 元 素 不 存在 属性 id 或 ame， 则 无 法 使 用 这 种 定位 方式 。 通 党 
下 ， 一 个 网 页 中 ， 元 素 的 i 或 name 的 属性 值 是 唯一 的 ， 如 果 多 个 元 素 的 id 或 name 相 
这 种 定位 方式 只 能 定位 第 一 个 元 素 。 


。 具 


属性 


情况 


同 ， 


(2) find element by_class name 和 find element by tag name 分别 通过 元 素 属 性 class 


和 元 素 标签 类 型 进行 定位 。 在 一 个 网 页 里 ， 属 性 class 的 属性 值 可 以 被 多 个 元 素 使 用 ， 同 


不 


元 素 标 签 也 可 以 多 次 使 用 ， 正 因 如 此 ， 这 两 种 定位 方式 只 能 定位 符合 条 件 的 第 一 个 元 素 。 
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(3) find_element by_link text 和 find_element by_partial link text 是 根据 标签 值 进 行 
定位 。 比 如 单 击 豆瓣 电影 网 的 排行 榜 ， 通 过 网 页 的 文字 来 对 元 素 进行 定位 。 若 网 页 中 的 文 
字 并 不 是 唯一 ， 那 么 Selenium 也 是 默认 定位 第 一 个 符合 条 件 的 元 素 。 

(4) find element by xpath 和 find _ element by css selector 是 由 xpath 和 css_selector 
实现 定位 ， 两 者 是 一 个 定位 选择 器 ， 通 过 标签 的 路 径 来 实现 定位 。 标 签 的 路 径 是 指 当前 标 
签 在 整个 HTML 代码 里 的 代码 位 置 ， 比 如 <body> 里 的 第 二 个 <div> 标 签 ，<div> 又 嵌 套 <p> 
标签 ， 那么 <p> 的 路 径 为 body -> div[1] -> p。 这 种 定位 方式 相对 前 面 的 定位 较为 精准 ， 因 
为 每 个 标签 的 路 径 都 是 唯一 的 。 


我 们 以 豆瓣 电影 网 为 例 ， 具 体 讲述 8 种 定位 方式 的 使 用 ， 代 码 如 下 : 


from selenium import webdriver 

url = 'https://movie.douban.com/' 

driver = webdriver.Chrome () 

driver.get (url) 

# 定位 

driver.find element by id('inp-query') .send keys(' 红 海 行动 ') 
driver.find element by name('search text') .send keys(' 我 不 是 药 神 ') 


find_element_by_id 和 find_element_by_name 都 是 定位 网 页 的 搜索 框 ， 并 在 搜索 框 里 输 
入 文本 信息 。 文 本 框 的 元 素 信 息 如 图 8-8 所 示 。 


虞 


class name = driver.find element by class name('nav-items').text 
tag name = driver.find element by tag name('div').text 
print (' 由 class_name 定位 : '，class_name) 


print (' 由 tag_name 定位 : '，tag_name) 


豆 办 电影 


影讯 & 购 票 。 选 电影 人 电视 剧 。 排行 榜 分 类 影评 


Elements Console Sources Network Perfgfrance Memory Application Security 


vediv class="inp 
Anput ig="inp-query” name="search_text” size="22”maxlength="60”placeholder=" 搜 索 电 
影 、 电视剧 、 综 艺 、 影 人 ”value autoccmplete="off"》 == 89 


图 8-8 ”搜索 框 元 素 信息 
上 述 两 种 方式 分 别 用 于 定位 不 同 的 网 页 元 素 。class_name 定位 class 属性 值 为 nav-items 
的 标签 ，tag_name 定 位 HIML 里 面 第 一 个 <div> 标 签 ， 两 者 定位 元 素 后 ， 再 使 用 text 方 法 来 
获取 元 素 值 并 输出 。 元 素 信息 如 图 8-9 所 示 。 
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bnsole Sources 


RR Elements 


pik Performance Memory Application 


html lang="zh-cmn-Han 
chead>-c/head 
v <body 
link nref-"//ime3.dhubanio. con/gae/a#o 
type-="text/css 


, CT ln cl lof | 


Yescripty-</Scr 了 pt 


redl 


link href-="//ime3.doubanio. com/daefaccounts/resources/9246c88/movie/bundle css” re] 
type="text/css 
vediv id="db-nav-movie” class="nav 
*<di 


ss="nayv-secondary 


图 8-9 class_ name 和 tag_name 定位 元 素 


link text = driver.find element by link text(" 排 行 榜 ') .text 

partial text = driver.find element by partial link text(' 部 正在 热 映 ') .text 
print(" 由 1ink text 定位 : '，1link text) 

print(' 由 partial link text 定位 : "，Ppartial text) 


上 述 代 码 是 将 网 页 中 含有 “排行 榜 ” 和 “部 正在 热 映 ”的 内 容 进行 定位 ，“ 排 行 榜 ” 
页 中 只 出 现 一 次 ，link text 是 对 内 容 进行 精准 定位 ， 比 如 网 页 中 出 现 “ 排 行 榜 ” 和 
语 排行 榜 ”，link_text 只 能 定位 到 “排行 榜 ”。 而 “部 正在 热 映 ” 是 网 页 内 容 “ 全 部 
正在 热 映 >” 的 部 分 内 容 ，partial link text 是 可 以 进行 模糊 匹配 ， 所 以 Selenium 会 自动 定位 
“全 部 正在 热 映 >”” 这 个 元 素 。 如 图 8-10 所 示 。 


在 网 


‘ 


| 


影讯 & 购 票 。 选 电 影 。 电视 剧 


| 
由 partial_link_text 定 位 由 link_text 定 位 


二 
正在 热 映 将 上 映 » 


图 8-10 link text 和 partial link_text 定位 元 素 


xpath = driver.find element by xpath('//* 
[@id="db-nav-movie"]/div[1]/div/div[1]/a') .text 

selector = driver.find element by css_ selector('#db-nav-movie 
> div.nav-wrap > div > div.nav-logo > a') .text 

print (' 由 xpath 定位 : '，xpath) 

print(" 由 css_selector 定位 : ' 7 Selector) 
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例子 中 的 定位 选择 器 xpath 和 css_selector 都 是 定位 class 属性 值 为 nav-logo 的 <div> 标 
签 里 的 <a> 标 签 ， 然 后 再 获取 该 标签 的 值 并 输出 。xpath 和 css_selector 的 语法 编写 规则 是 各 
不 相同 。 一 般 情 况 下 ， 在 Google Chrome 里 可 以 快速 获取 两 者 的 语法 。 首 先 在 Google 
Chrome 的 Elements 标签 页 里 ， 找 到 某 个 元 素 的 位 置 ， 然 后 右 击 选择 “Copy”， 最 后 选择 
“Copy Xpath” 或 “Copy selector” 即 可 获取 相应 的 语法 。 如 图 8-11 所 示 。 


7 了 国 可 8 电 河 
C 


vedi 


x 


四 去 全 hl Addattibute 
Edit attribute 
Edit as HTML 


Delete element 


Copy Cut element 


\ Copy element 
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Break on Copy outerHTML plication 。 Securiy 。 Audits 


Copy selector ~ Styes Computed EventLsteners 罗 


Copy XPath 


Expand recursively 
Collapse children 
Scroll into view 


Focus 


v class- “nav-search 


*xform action-“https;//movie.douban, com/subject_search™ method. “get”> 
/form; 

/div 

/diy: 


1div 
vediv < 


html body ¢ 


1ass=rnav-5econdary 


divhdb-nal nav divnav-wrap divnav-primery divnav-logo 


图 8-11 xpath 和 css_selector 语法 获取 


上 述 8 种 定位 方式 只 能 定位 到 第 一 个 元 素 ， 如 果 有 多 个 相同 的 元 素 ， 并 且 想 全 部 获 


可 以 使 


find_elel 
find_elel 
find_elel 
find_elel 


以 下 定位 方式 : 


ments_by id() 
ments_by_name () 

ments by class_name () 
ments by tag_name () 


find elements by link text() 
find elements by partial link text() 


find elements by xpath () 


find elements by css_ selector() 


这 8 种 定位 方式 与 上 述 的 定位 方式 非常 相似 ， 两 者 的 唯一 不 同 就 是 elements 和 
element。 前 者 定位 全 部 符合 条 件 的 元 素 ， 后 者 只 获取 第 一 个 符合 条 件 的 元 素 。 


关于 上 述 


所 提 及 到 的 xpath 和 css_selector 的 语法 编写 ， 有 兴趣 的 读者 可 以 自行 查阅 相 


关 的 资料 进一步 了 解 两 者 的 语法 编写 规则 。 
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8.5 Selenium 操控 元 素 


6 


苹 


、 
未 对 


一 


操控 网 页 元 素 须 在 网 页 元 素 定 位 后 才能 执行 ，Selenium 可 以 模拟 任何 操作 ， 比 如 单 
右 击 、 拖 拉 、 滚 动 、 复 制 粘 贴 或 者 文本 输入 等 。 操 作 方式 分 为 三 大 类 : 常规 操作 、 鼠 
攻 件 操作 和 键盘 事件 操作 。 

常规 操作 包含 有 文本 清除 、 文 本 输入 、 单 击 元 素 、 提 交 表单 、 获 取 元 素 值 等 。 以 QQ 


音乐 注册 为 例 〈https://ssl.zc.qq.com/v3/index-chs.html?from=pt) ， 具 体 的 使 用 方式 如 下 : 


[= 


容 、 


from selenium import webdriver 

url = 'https://ssl.zc.qq.com/v3/index-chs.html?from=pt" 
driver = webdriver.Chrome () 

driver.get (url) 

# 输入 名 字 和 密码 

driver.find element by id('nickname').send keys('pythonAuto') 
driver.find element by _ id('password') .send keys('pythonAuto123') 
# 获取 手机 号 码 下 方 的 tips 内 容 

tipsValue = driver.find element by xpath( 
'//div[3]/div[2]/div[1]/form/div[7]/div') .text 

print (tipsValue) 

# 勾 选 同时 开通 oo 空间 

driver.find element by class name('checkbox').click() 

# 单 击 * 注 册 “ 按 钮 


driver.find element by id('get acc').submit() 


上 述 例子 对 网 页 的 昵称 和 密码 的 文本 框 执行 文本 输入 、 获 取 手 机 号 码 下 方 的 tips 内 
勾 选 “同时 开通 QQ 空间 ”选项 和 单 击 “ 注 册 ” 按 钮 ，4 种 操作 分 别 由 send_keys、text、 


click 和 submit 方法 实现 。 其 中 click 和 submit 在 某 些 情况 下 可 以 相互 使 用 ，submit 只 用 于 
表单 的 提交 按钮 ，click 是 强调 事件 的 独立 性 ， 可 用 于 任何 按钮 。 下 面 ， 我 们 列 出 了 一 些 实 
际 开发 中 常见 的 操作 方式 : 


# 清空 xX 标签 的 内 容 

driver.find element by id('X').clear() 

# 获取 元 素 在 网 页 中 的 坐标 位 置 ， 坐 标 格式 : {'y': 19,，'zx': 498} 
location = driver.find element by id('X') .location 

# 获取 元 素 的 某 个 属性 值 ， 如 获取 x 标签 的 id 属性 值 


attribute = driver.find element by id('x') .get attribute('id') 
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## 判断 X 元素 在 网 页 上 是 否 可 见 ， 返 回 值 为 True 或 False 

result = driver.find _ element by id('x').is displayed() 

# 判断 X 元素 是 否 被 选 ， 通 常用 于 checkbox 和 radio 标签 ， 返 回 值 为 True 或 False 
result = driver.find _ element by id('X") .is selected() 

"miselect 标签 的 选 信 """ 
from selenium.webdriver.support.select import Select 
# 根据 下 拉 框 的 索引 来 选取 
Select (driver.find element by id('X')).select by index('2') 
# 根据 下 拉 框 的 value 属性 来 选取 
Select (driver.find element by id('X')) .select by index('Python') 


# 根据 下 拉 框 的 值 来 选取 


Select (driver.find element by id('X')).select by visible text('Python') 


以 上 是 元 素 的 常规 操作 方法 ， 接 着 讲述 鼠标 事件 的 操作 方法 ， 鼠 标 事件 操作 由 
Selenium 的 ActionChains 类 来 实现 。ActionChains 类 定义 了 多 种 鼠标 操作 方法 ， 具 体 的 操作 


方法 说 明 如 表 8-3 所 示 。 


操作 方法 


perform 


reset_actions 


click 


click and hold 


表 8-3 ActionChains 类 的 鼠标 操作 方法 


执行 鼠标 事件 


取消 鼠标 事件 


长 按 鼠 标 左 键 


示 例 


click(element).perform() 

click 是 鼠标 单 击 事件 
perform 是 执行 这 个 单 击 事件 
click(element).reset_actions() 
click 是 鼠标 单 击 事件 
reset_actions 是 取消 单 击 事件 
click(element) 

element 是 某 个 元 素 对 象 
click and_ hold(element) 
element 是 某 个 元 素 对 象 


context_click 


长 按 鼠 标 右键 


context_click(element) 
element 是 某 个 元 素 对 象 


double_click 


鼠标 双击 


double_click(element) 
element 是 某 个 元 素 对 象 


drag and drop 


对 元 素 长 按 左 键 并 移动 到 
另 一 个 元 素 的 位 置 后 释放 
鼠标 左 键 


drag_and_drop(element, elementl) 
element 是 某 个 元 素 对 象 
elementl 是 目标 元 素 对 象 


操作 方法 


明 


第 8 章 网 页 自动 化 开发 | 103 
( 续 表 ) 
例 


示 


drag and drop by _ offset 


对 元 素 长 按 左 键 并 移动 到 


drag and drop by_offset(element, x, y) 
element 是 某 个 元 素 对 象 


指定 的 坐标 位 置 x 是 偏 移 的 x 坐标 
y 是 偏 移 的 y 坐标 
Sm key_down(Keys.CONTROL., element) 
0 1 个 
key_down ei 的 某 1 Keys.CONTROL 是 由 Keys 定义 的 键盘 事件 
区 element 是 某 个 元 素 对 象 
ee key_up(Keys.CONTROL., element) 
对 元 素 释 中 的 某 个 
key_up Wii Keys.CONTROL 是 由 Keys 定义 的 键盘 事件 


按键 


element 是 某 个 元 素 对 象 


move_by_offset 


move_to_element 


对 当前 鼠标 所 在 位 置 进行 
偏 移 


将 鼠标 移动 到 某 个 元 素 所 


在 的 位 置 


move_by_offset(x, y) 

x 是 偏 移 的 x 坐标 

y 是 偏 移 的 y 坐标 
move_to_element(element) 
element 是 某 个 元 素 对 象 


move_to_element with offset(element, x, y) 


i 将 鼠标 移动 到 某 个 元 素 并 | element 是 某 个 元 素 对 象 
Se 二 偏 移 一 定 的 位 置 x 是 偏 移 的 x 坐标 
y 是 偏 移 的 y 坐标 
pause 设置 暂停 执行 时 间 pause(1000) 
Telease(element) 
i i element 是 某 个 元 素 对 象 。 
nS 避风 师 标 共 近 瑰 作 如 果 element 为 空 ， 对 当前 鼠标 的 位 置 长 按 
操作 进行 释放 。 
send keys 执行 文本 输入 eno Tey (vet) 


value 是 输入 的 内 容 


send_ keys_to_element(element, value) 


send_ keys_to_element 对 当前 元 素 执行 文本 输入 | element 是 某 个 元 素 对 象 
value 是 输入 的 内 容 
上 表 讲 述 了 各 种 鼠标 事件 操作 ， 这 些 方法 都 是 在 ActionChains 类 所 定义 的 类 方法 ， 若 
想 使 用 这 些 操作 方法 ， 必 须 将 ActionChains 类 实例 化 后 才能 调用 。 以 B 站 的 登录 页 面 为 


例 ， 通 过 鼠标 操作 方法 去 双击 网 页 中 的 “登录 ”标题 以 及 拖拉 验证 滑 条 ， 具 体 代码 如 下 : 
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from selenium import webdriver 

from selenium.webdriver.common.action chains import ActionChains 
import time 

url = "https://passport.bilibili.com/1login' 

driver = webdriver.Chrome () 

driver.get (url) 

# 双击 登录 


element = driver.find element by class name('tit') 


ActionChains (driver) .double click(element) .perform() 

# 设置 延 时 ， 否 则 会 导致 操作 过 快 

time.sleep(3) 

# 拖拉 滑 条 

element = driver.find element by class name('gt slider knob,gt show') 
ActionChains (driver) .drag and drop by offset (element, 100, 0).perform() 


上 述 代 码 中 ， 首 先 将 ActionChains 实例 化 ， 实 例 化 的 时 候 传 入 driver 对 象 。driver 是 
chromedriver 打开 的 浏览 器 对 象 ， 这 是 告诉 ActionChains 的 操作 浏览 器 对 象 是 driver。 实 例 
化 之 后 就 可 以 直接 调用 鼠标 事件 操作 方法 ， 这 些 方法 需要 传 入 element 对 象 ，element 是 网 
页 中 某 个 标签 元 素 。 最 后 再 调用 perform 方法 ， 这 是 一 个 执行 命令 ， 因 为 鼠标 操作 可 以 拖 
拉 、 长 按 鼠 标的 左 键 或 右键 ， 这 是 一 个 持久 性 的 操作 ， 而 调用 perform 方法 可 以 让 这 个 鼠 
标 操作 马上 执行 。 

最 后 讲述 键盘 事件 操作 ， 它 是 模拟 人 为 按 下 键盘 的 某 个 按键 ， 主 要 通过 send keys 方 
法 来 实现 。 在 上 述 例子 中 ，send keys 用 于 文本 内 容 的 输入 ， 而 下 面 的 示例 是 通过 
send_keys 来 触发 键盘 按钮 来 实现 内 容 的 输入 。 以 百度 搜索 为 例 ， 利 用 键盘 的 快捷 键 实现 搜 
索 内 容 的 变换 ， 有 具体 代码 如 下 : 


from selenium import webdriver 


from selenium.webdriver.common.keys import Keys 
import time 


driver = webdriver.Chrome () 
driver.get ("http://www.baidu.com") 


# 获取 输入 框 标签 对 象 

element = driver.find element by id('kw') 
# 输入 框 输入 内 容 

element .send keys ("Python 你 ") 
time.sleep (2) 


# 删除 最 后 的 一 个 文字 
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element .sendq keys (Keys.BACK SPACE) 


time.sleep (2) 


# 添加 输入 空格 键 + “教程 


element .send keys (Keys .SPACE) 


element .senqd keys ("教程 ") 
time.sleep (2) 


# ctrl+a 全 选 输入 框 内 容 


element .send keys (Keys.CONTROL, 'a') 


time.sleep (2) 


# ctrl+x 前 切 输入 框 内 容 


element .send keys (Keys.CONTROL, ‘'x') 


time.sleep (2) 


# ctrl+v 粘贴 内 容 到 输入 框 


element .send_ keys (Keys.CONTROL, 'v') 


time.sleep(2) 


# 通过 回 车 键 来 代替 单 击 操作 


driver.find _ element by id('su').send keys (Keys .ENTER) 


只 要 运行 上 述 代码 就 能 看 到 键盘 事件 操作 的 过 程 。 此 外 ，Keys 类 还 定义 了 键盘 上 各 个 
快捷 键 ， 具 体 的 定义 方式 可 以 查看 Keys 类 的 源码 ， 源 码 地 址 在 Python 安装 目录 的 


Lib\site-packages\selenium\webdriver\common\keys.py。 


8.6 ”Selenium 常用 功能 


在 前 面 的 内 容 中 ， 我 们 已 经 学 习 Selenium 的 基本 使 用 方法 ， 掌 握 了 如 何 启动 浏览 器 、 


查找 并 定位 网 页 元 素 以 及 网 页 元 素 


4 操控 。 本 节 中 ， 我 们 讲述 Selenium 的 一 些 常用 功能 ， 


如 设置 浏览 器 的 参数 、 浏 览 器 多 窗 


切换 、 设 置 等 待 时 间 、 文 件 的 上 传 与 下 载 、Cookies 处 


理 以 及 frame 框架 操作 。 


设置 浏览 器 的 参数 是 在 定义 driver 的 时 候 设置 chrome _options 参数 ， 该 参数 是 一 个 


Options 类 所 实例 化 的 对 象 。 其 中 常 


的 参数 是 设置 浏览 器 是 否 可 视 化 和 浏览 器 的 请 求 头等 


信息 ， 前 者 可 以 加 快 代码 的 运行 速度 ， 后 者 可 以 有 效 地 防止 网 站 的 反 申 虫 检 测 。 有 具体 的 代 


码 如 下 : 
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from selenium import webdriver 

# 导入 Options 类 

from selenium.webdriver.chrome.options import Options 

url = "https://movie.douban-com/" 

# Options 类 实例 化 

Chrome options = Options () 

# 设置 浏览 器 参数 

# --headless 是 不 显示 浏览 器 启动 及 执行 过 程 

chrome options.add argument ('--headless') 

# 设置 lang 和 User-Agent 信息 ， 防 止 反扑 虫 检测 

chrome options.add argument ('lang=zh CN.UTF-8') 

UserAgent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 
(KHTML, like Gecko) Chrome/68.0.3440.84 Safari/537.36' 

chrome options.add argument ('User-Agent=' + UserAgent) 

## 启动 浏览 器 并 设置 chrome_options 参数 

driver = webdriver.Chrome (chrome options=chrome options) 

# 浏览 器 窗口 最 大 化 

# driver.maximize _ window() 

# 浏览 器 窗口 最 小 化 

# driver.minimize window() 

driver.get (url) 

# 获取 网 页 的 标题 内 容 

print (driver.title) 

# page_source 是 获取 网 页 的 HTML 代码 


print (driver.page source) 

浏览 器 多 窗口 切换 是 在 同一 个 浏览 器 中 切换 不 同 的 网 页 窗口 。 打 开 浏 览 器 可 以 看 到 ， 
浏览 器 顶部 可 以 不 断 添 加 新 的 窗口 ， 而 Selenium 可 以 通过 窗口 切换 来 获取 不 同 的 网 页 信 
息 。 具 体 代码 如 下 : 


from selenium import webdriver 

import time 

url = 'https://www.baidu.com/"' 

driver = webdriver.Chrome () 

driver.get (url) 

# 使 用 Javascript 开启 新 的 窗口 

js = 'window.open ("https://www.sogou.com");" 
driver.execute script (js) 

# 获取 当前 显示 的 窗口 信息 


current window = driver.current window handle 
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## 获取 浏览 器 的 全 部 窗口 信息 

handles = driver.window handles 

# 设置 延 时 可 以 看 到 切换 效果 
time.sleep (3) 

# 根据 窗口 信息 进行 窗口 切换 

# 切换 百度 搜索 的 窗口 
driver.switch to window(handles[0]) 
time.sleep (3) 

# 切换 搜狗 搜索 的 窗口 


driver.switch to window (handles[1]) 


上 述 代 码 中 ， 使 用 了 execute_script 方法 ， 这 是 通过 浏览 器 运行 JavaScript 代码 生成 新 
的 窗口 ， 然 后 获取 浏览 器 上 的 全 部 窗口 信息 ，window_handles 方法 是 获取 当前 浏览 器 的 窗 
信息 ， 并 以 列表 的 形式 表示 ， 最 后 由 switch_to_window 方法 进行 窗口 之 间 的 切换 。 千 万 
不 要 小 看 execute_script 方法 ， 很 多 浏览 器 的 插件 都 是 由 JavaScript 来 实现 的 ， 可 想 而 知 它 
的 作用 是 多 么 的 强大 。 

Selenium 的 执行 速度 相当 快 ， 在 Selenium 执行 的 过 程 中 往往 需要 等 待 网 页 的 响应 才能 
执行 下 一 个 步骤 ， 否 则 程序 会 抛 出 异常 信息 。 网 页 响应 的 快慢 取决 于 多 方面 的 因素 ， 因 此 
在 某 些 操作 之 间 需 要 设置 一 个 等 待 时 间 ， 让 Selenium 与 网 页 响应 尽量 达到 同步 执行 ， 这 样 
才能 保证 程序 的 稳健 性 。 在 前 面 的 例子 中 ， 延 时 是 使 用 Python 内 置 的 time 模块 来 实现 的 ， 
而 Selenium 本 身 也 提供 了 延 时 的 功能 ， 有 具体 的 使 用 方法 如 下 : 


from selenium import webdriver 

url = 'https://www.baidu.com/ 

driver = webdriver.Chrome () 

driver.get (url) 

# 隐 性 等 待 ， 最 长 等 待 时 间 为 30 秒 

driver.implicitly wait (30) 

driver.find element by id('kw').send keys('Python') 

# 显 性 等 待 

from selenium.webdriver.support.wait import WebDriverWait 

from selenium.webdriver.common.by import By 

from selenium.webdriver.support import expected conditions 

# visibility of element located 检查 网 页 元 素 是 否 可 见 

# (By.ID，'kw'): kw 是 搜索 框 的 id 属性 值 ，By .ID 是 使 用 find element by id 定位 

condition = expected conditions.visibility of element located((BY.ID,， 
'kw')) 

WebDriverWait (driver=driver, timeout=20, 


poll frequency=0.5) .until (condition) 
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隐 性 等 待 是 指 在 一 个 设 定 的 时 间 内 检测 网 页 是 否 加 载 完 成 ， 也 就 是 一 般 情况 下 你 看 
浏览 器 标签 栏 那个 小 圈 不 再 转 ， 才 会 执行 下 一 步 。 比 如 代码 中 设置 30 秒 等 待 时 间 ， 网 页 
要 在 30 秒 内 完成 加 载 就 会 自动 执行 下 一 步 ， 如 果 超 出 30 秒 就 会 抛 出 异常 。 值 得 注意 
是 ， 隐 性 等 待 对 整个 driver 的 周期 都 起 作用 ， 所 以 只 要 设置 一 次 即 可 。 

显 性 等 待 能 够 根据 判断 条 件 而 进行 灵活 地 等 待 ， 程 序 每 隔 一 段 时 间 检 测 一 次 ， 如 果 
测 结果 与 条 件 成 立 了 ， 则 执行 下 一 步 ， 否 则 继续 等 待 ， 直 到 超过 设置 的 最 长 时 间 为 止 ， 
后 抛 出 TimeoutException 异常 。 显 性 等 待 的 使 用 涉及 到 多 个 模块 ， 包 括 By 
expected_conditions 和 WebDriverWait， 各 个 模块 说 明 如 下 。 


e@ By: 设置 元 素 定 位 方式 ， 定 位 方式 共 
B 设置 元 素 定位 方式 ， 定 位 方式 共 8 种 : ID 、XPATH 、LINK_TEXT 


到 


只 


的 


检 


、 


PARTIAL LINK TEXT. NAME. TAG NAME、CLASS NAME、CSS_SELECTOR。 


@ expected_conditions: 验证 网 页 元 素 是 否 存在 ， 提 供 了 多 种 验证 方式 。 具 体 可 以 查看 
码 : Lib\site-packages\selenium\webdriver\support\expected_conditions.py 
WebDriverWait 的 参数 说 明 如 下 。 


driver: 浏览 器 对 象 driver。 
timeout: 超时 时 间 ， 等 待 的 最 长 时 间 。 
poll_frequency: 检测 时 间 的 间隔 。 


ignored_exceptions: 忽略 的 异常 ， 如 果 在 调用 until 或 until_ not 的 过 程 中 抛 出 的 异常 在 这 


个 参数 里 ， 则 不 中 断代 码 ， 继 续 等 待 ， 如 果 抛 出 的 异常 在 这 个 参数 之 外 ， 则 中 断代 码 


并 抛 出 异常 。 默 认 值 为 NoSuchElementException 。 


@ until: 条 件 判 断 ， 参 数 必 须 为 expected_conditions 对 象 。 如 果 网 页 里 某 个 元 素 与 条 件 符 


合 ， 则 中 断 等 待 并 执行 下 一 个 步骤 。 
e nntil not: 与 until 的 逻辑 相反 。 


隐 性 等 待 和 显 性 等 待 相 比 于 time.sleep 这 种 强制 等 待 更 为 灵活 和 智能 ， 可 解决 各 种 网 
延误 的 问题 ， 隐 性 等 待 和 显 性 等 待 可 以 同时 使 用 ， 但 最 长 的 等 待 时 间 取 决 于 两 者 之 间 的 
大 数 ， 如 上 述 代 码 的 隐 性 等 待 时 间 为 30， 显 性 等 待 时 间 为 20， 则 该 代码 的 最 长 等 待 时 间 
隐 性 等 待 时 间 。 

上 传 文件 在 网 页 中 是 用 上 传 按钮 来 显示 ， 通 过 单 击 按钮 就 会 打开 本 地 电脑 的 一 个 文 
对 话 框 ， 在 文件 对 话 框 选 择 文件 并 确认 即 可 上 传 文件 路 径 。 而 Selenium 实现 过 程 相对 


单 ， 只 需 定位 到 网 页 的 上 传 按钮 并 使 用 send_keys 方法 来 写 入 文件 路 径 即 可 实现 ， 如 
所 示 : 


络 
最 
为 
从 


简 


3 


制 ， 
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HTML 的 元 素 信息 

<div class="row-fluid"> 

<div class="span6 well"> 

<h3>upload file</h3> 

<input type="file" name="file" /> 

</div> 

</div> 

# Selenium 定位 

driver.find element by _ name ("file") .send keys("D:\file.txt") 


在 网 页 中 ， 文 件 上传 有 多 种 实现 方式 ， 但 无 论 怎样 哪 一 种 方式 ， 只 要 分 析 好 上 传 的 机 
都 可 以 使 用 Selenium 实现 。 而 文件 下 载 的 原理 与 文件 上 传 是 一 样 的 ， 具 体 代码 如 下 


所 示 : 


from selenium import webdriver 

# 设置 文件 保存 的 路 径 ， 如 不 设置 ， 默 认 系统 的 Downloads 文件 夹 
options = webdriver.ChromeOptions () 

prefs = {'download.default directory': 'd:\\'} 
options.add experimental option('prefs', prefs) 
# 启动 浏览 器 

driver = webdriver.Chrome () 

# 下 载 微 信 Pc 版 安装 包 

driver.get ('https://pc.weixin.qq.com/') 

# 浏览 器 窗口 最 大 化 

driver.maximize window() 

# 单 击 下 载 按钮 


driver.find _ element by_class_name ('button') .click() 


下 面 讲 述 浏览 器 的 Cookies 使 用 ，Cookies 操作 无 非 就 是 读 取 、 添 加 和 删除 Cookies。 


Cookies 信息 可 以 在 浏览 器 开发 者 工具 的 Network 标签 页 查看 ， 查 看 步骤 如 图 8-12 所 示 。 


有 9 


从 图 8-12 中 可 以 看 到 ， 一 个 网 页 的 Cookies 可 以 有 多 条 Cookie 数据 组 成 ， 每 条 数据 都 
个 属性 。 而 我 们 需要 检测 Selenium 获取 Cookies 信息 与 图 上 的 数据 格式 是 否 一 致 ， 具 


from selenium import webdriver 
import time 

启动 浏览 器 

driver = webdriver.-Chrome () 
driver.get ('https://www.youdao.com') 
time.sleep (5) 
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# 添加 Cookies 


driver.add cookie ({'name': "Login User', 'value': 'PassWord'}) 


# 获取 全 部 Cookies 


all cookies = driver.get cookies() 

print(" 全 部 的 Cookies 为 : '，all cookies) 

# 获取 name 为 Login User 的 Cookie 内 容 

one cookie = driver.get cookie('Login User') 
print (' 单 个 的 Cookie 为 : '，one cookie) 

# 删除 name 为 Login User 的 Cookie 


driver.delete cookie('Login 


User') 


surplus cookies = driver.get cookies() 
print (' 剩 余 的 Cookie 为 : '，surplus cookies) 


# 删除 全 部 Cookies 


driver.delete all cookies () 


surplus_cookies = driver.get_cookies () 
print (' 剩 余 的 Cookie 为 : '，surplus_cookies) 


沉 百度 下, 你 加 和 0 道 x 
号 


C  @ 安全 https//www baiducom 


区 glcCcm 昌 必 


Application Security 


Manifest Other 


Step 2 


Value Domain | Path Expires/,, |Size |HTTP | Secure |Sam. 


639 


A8A520ED82F .| NA | NA N/A 47 


BAGOBSEBFGF3.. | NA。 | NA NAStep 5 40 
167x6Tihwwvfo IN/A -|N/A /A 


36 


ktModhd3pQb.. IN/A |NA NA 200 


1/63 requests | 503 


NA INA NA 3 


图 8-12 查看 Cookies 信息 


运行 上 述 代 码 可 以 发 现 ， 代 码 输 出 的 Cookies 信息 以 列表 的 形式 展示 ， 列 表 的 每 个 元 


素 是 一 个 字典 ， 并 且 字 典 键 值 都 能 与 


图 上 的 Cookies 信息 一 一 对 应 。 


frame 是 一 个 框架 页 面 ， 在 HIMLS 已 经 不 支持 使 用 这 个 框架 ， 但 在 一 些 网 站 中 依然 会 
看 到 它 的 身影 。frame 的 作用 是 在 HTML 代码 里 面 嵌 套 一 个 或 多 个 不 同 的 HIML 代码 ， 每 
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联 套 一 个 HIML 都 需要 由 frame 来 实现 。 以 百度 知道 的 问题 (https://zhidao.baidu.com/ 
list?cid=110106) 为 例 ， 打 开 某 条 题目 ， 题 目的 回答 数 最 好 是 0 


党 同 是 分 关 百度 过 


互 


El 


答 ， 如 图 8-13 所 示 。 


x WR 


C | @ 安全 | https:;//zhidao.baidu.com/list?cid=1 


0106 


python pygame 问 题 [om | 
问 5 ”notepad 配置 python 提 示 python 不 是 内 部 或 外 部 命令 但 是 cmd 蛙 面 输 入 python 不 报 镭 可 以 运行 


Python 如 何 写 上 一 接口 


图 8-13 ”百度 知道 问题 列表 
单 击 图 8-13 上 的 问题 链接 进入 问题 的 详细 信息 页 ， 并 且 打 开 开 发 者 工具 的 Elements 标 
签 页 ， 快 速 定位 到 文本 输入 框 ， 在 Elements 标签 页 可 以 看 到 这 个 文本 框 是 由 过 ame 框架 页 
面 生 成 的 。 过 ame 和 frame 实现 的 功能 是 相同 的 ， 只 不 过 使 用 方式 和 灵活 性 有 所 不 同 ， 不 管 
是 过 ame 或 frame，Selenium 的 定位 和 操作 方式 都 是 一 样 的 。iframe 框架 信息 如 图 8-14 所 示 。 


Elements (Console Sources Network Performance 


Memory Application 
veiframe id="veditor 0" width="100%" height="108%" frameborder="0" src="javascript: | 
<html xmlns="http://www.w3.org/1999/xhtml" class='view' ><head>¢style type='text/css 
body{margin:Spx;font-family:sans-serif;font-size:16px;}ptmargin:Spx ©;}¢/style><link 
iframe.css'/></head>¢body class='view' >¢/body>¢script type='text/javascript’ id='_ 
window. parent .UE.instants[ "veditorInstant@" ];editor._setup(document);},0);var _tmpsc 直 
tmpScript.parentNode. removeChild(_tmpScript);¢/script></html>");document .close();}( 
v#document 


Security Audits 


| 
| 
| 


图 8-14 百度 知道 问题 详情 页 


于 一 个 HIML 可 以 嵌 套 了 一 个 或 多 个 的 过 ame， 那 么 Selenium 在 操作 不 同 的 过 ame 


需要 通过 switch to.frame0 来 切换 到 指定 的 过 ame， 再 执行 相应 的 操作 。 比 如 一 个 网 页 中 有 
多 个 过 ame， 各 个 过 ame 的 信息 如 图 8-15 所 示 。 
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这 是 iframe_b 这 是 iframe < 


这 是 iframe d 


图 8-15 这 ame 信息 


图 8-15 上 一 共有 3 个 过 ame， 在 当前 网 页 里 嵌 套 了 2 个 过 ame， 其 中 第 一 个 iframe 旨 
面 又 柑 套 了 一 个 ifame， 那 么 Selenium 对 各 个 过 ame 定位 方法 如 下 : 


from selenium import webdriver 
url = “XXXXX" 

driver = webdriver.Chrome () 
driver.get (url) 


""" 定位 到 第 一 个 iframe """ 

# 通过 索引 定位 

driver.switch to.frame (0) 

# 通过 iframe 的 id 或 name 属性 定位 

driver.switch to.frame('iframe a') 

# 先 定位 iframe 再 切换 到 iframe a 

element = driver.find element by id("iframe a") 
driver.switch to.frame (element) 

# 从 iframe a 跳 回 HTML 

driver. switch to -default content () 


“ww 定位 到 第 二 个 iframe """ 

# 通过 索引 定位 

driver.switch to.frame (1) 

# 通过 iframe 的 id 或 name 属性 定位 
driver.switch to.frame('iframe b') 


# 先 定位 iframe 再 切换 到 iframe b 


也 


都 是 
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element = driver.find element by id("iframe b") 
driver.switch to.frame (element) 
# 从 iframe b 跳 回 HTML 


driver.switch to.default content () 


"nw 定位 到 第 三 个 iframe """ 

# 定位 到 iframe a 

driver.switch to.frame('iframe a') 
再 从 iframe a 切换 iframe d 
driver.switch to.frame('iframe d') 
# 从 iframe_ qd 跳 回 到 iframe a 
driver.switch to.parent frame() 

从 iframe d 跳 回 HTML 
driver.switch to.default content() 


从 上 述 代码 可 以 看 到 ， 不 管 是 HTML 切换 过 ame， A fame 之 间 的 切换 ， 实 现 过 程 
由 switch to 方 a 以 百度 知道 答题 为 例 ， 进 一 步 了 解 Selenium 对 iframe 的 操作 


方式 : 


from selenium import webdriver 

url = 'https://zhidao.baidu.com/question/1952259230876274508 .html' 
driver = webdriver.Chrome() 

driver.get (url) 

# 切换 到 frame 内 部 的 HTML 

driver.switch to.frame (0) 

# 定位 frame 内 部 的 元 素 

driver.find element by xpath('/html/body') .send keys('Python') 
# 跳 回 到 网 页 的 HTML 

driver.switch to.default content() 

# 单 击 提交 回答 按钮 


driver.find element by xpath('//*[@id="answer-editor"]/div[2]/a') .click() 


8.7 实战 .编写 “百度 自动 答题 ”程序 


[= 
“25 


册 过 


本 节 通 过 使 用 Selenium 来 实现 百度 知道 自动 答题 ， 在 讲述 之 前 ， 首 先 注册 一 个 百度 账 
在 浏览 器 上 打开 https://passport.baidu.com/v2/， 使 用 手机 号 码 即 可 完成 注册 ， 具 体 的 注 
程 不 再 详细 讲述 。 
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完成 用 户 注 册 后 ， 在 浏览 器 上 访问 https://zhidao.baidu.conylist?cid=110， 该 网 页 是 显示 
某 个 分 类 的 问题 列表 ， 每 条 问题 代表 一 条 链接 ， 单 击 链接 可 以 进入 问题 详细 页 ， 问 题 列 表 
页 面 和 问题 详情 页 分 别 如 图 8-13 和 图 8-14 所 示 。 


癌 pyhon pygameR 三 x 
CG a 安全 https//zh 


a 


在 问题 详情 页 里 面 ， 我 们 需要 根据 题目 搜索 相关 的 答案 ， 然 后 将 答案 写 到 问题 详情 页 
答 文本 框 里 ， 最 后 单 击 提交 回答 按钮 即 可 实现 答题 。 这 个 看 似 简 单 的 功能 却 涉及 到 三 
个 网 页 的 操控 。 首 先 获 取 问 题 详情 页 的 题目 ， 然 后 根据 题目 搜索 答案 ， 在 答案 列表 页 中 逐 
一 访问 每 个 答案 的 链接 ， 在 答案 详情 页 中 获取 合理 的 答案 ， 最 后 将 答案 写 回 到 问题 详情 页 
中 。 整 个 过 程 如 图 8-16 所 示 。 


从 2H3pyihon 轩 二 x 
idaot € CE 自 安 人 hpsy/zhi C 安全 | https://zhidao.baidu.cq 


ei or 


) python pygame 问 题 | 一 


jgame 中 如 何 格 变 量 的 什 绘制 到 而 划 上 


虐 这 是 没 问题 的 ， 你 按照 这 方法 去 查 一 下 ; 


8 到 PYTHON-SITEROOT\Lib\site-packag 
看 下 面 有 没有 除 init_ 中 


图 8-16 根据 题目 搜索 答案 


根据 上 述 的 简单 分 析 ， 整 个 实战 项 目 可 以 分 为 5 个 步骤 来 实现 ， 每 个 步骤 具体 说 明 如 下 : 


(1) 在 https://zhidao.baidu.com/list?cid=110 上 获取 问题 列表 ， 得 到 全 部 问题 的 地 址 链 
接 ， 然 后 遍历 访问 这 些 链接 ， 依 次 进入 问题 的 详情 页 。 

(2) 在 问题 详情 页 获取 问题 题目 ， 题 目 是 用 于 搜索 相关 的 答案 。 

(3) 搜索 答案 的 地 址 链接 都 是 固定 的 ， 如 图 上 所 示 ， 只 要 替换 地 址 中 word 后 面 的 内 
容 即 可 搜索 相关 的 答案 。 

(4) 得 到 搜索 结果 后 ， 获 取 答 案 列 表 的 地 址 并 遍历 访问 即 可 进入 答案 详情 页 ， 如 果 答 
案 详 情 页 里 面 有 最 佳 答案 就 会 获取 答案 内 容 ， 并 且 终 止 答案 列表 的 遍历 。 

(5) 将 得 到 的 答案 写 回 到 问题 详情 页 的 回答 文本 框 并 单 击 提交 回答 按钮 即 可 完成 答题 。 


整个 项 目 在 实现 过 程 中 是 在 用 户 已 登录 的 情况 下 执行 ， 如 果 使 用 百度 的 账号 密码 执行 


户 登录 ， 就 会 遇 到 手机 验证 码 或 图 片 验证 码 。 用 户 登录 后 ， 网 站 会 一 直 保 持 用 户 的 登录 
状态 ， 不 管用 户 是 否 重 启 浏览 器 ， 只 要 访问 百度 网 址 ， 用 户 登 录 信 息 都 会 显示 出 来 。 利 用 
户 登 录 的 状态 ，Selenium 可 以 模拟 用 户 登录 并 将 用 户 登录 后 的 Cookies 保存 下 来 ， 在 下 
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次 登录 的 时 候 ， 直 接 读 取 并 操控 Cookies 即 可 完成 用 户 登录 。 功 能 代码 如 下 所 示 : 


from selenium import webdriver 
import json, time 
# 百度 用 户 登 录 并 保存 登录 Cookies 
driver = webdriver.Chrome () 
driver.get ("https://www.baidu.com/") 
driver.find element by xpath('//*[@id="ul"]/a[7]') .click() 
time.sleep (3) 
driver.find element by id('TANGRAM PSP 10 footerULoginBtn').click!() 
time.sleep (3) 
# 设置 用 户 的 账号 和 密码 
driver.find element by xpath('//*[@id="TANGRAM PSP 10 userName"]') .sen 
d_ keys('Xx') 
driver.find element by xpath('//*[@id="TANGRAM PSP 10 password"]') .sen 
d keys('XxX') 
EY 
verifyCode = driver.find element by name('verifyCode') 
code_number = input (' 请 输入 图 片 验 证 码 : ') 
verifyCode. send keys(str(code number)) 
except: pass 
driver.find element by xpath('//*[@id="TANGRAM PSP 10 submit"]'). click() 
time.sleep (3) 
GE 
driver.find element by xpath 
('//*[@id="TANGRAM 36 button send mobile"]').click!() 
code_photo = input (' 请 输入 短信 验证 码 : ' ) 
driver.find element by xpath('//*[@id="TANGRAM 36 input vcode"]'). 
send keys(str(code photo)) 
driver.find element by xpath('//*[@id="TANGRAM 36 button submit"]'). 
click() 
time.sleep(3) 
except: pass 
cookies = driver.get cookies() 
fl = open('cookie.txt', 'w') 
fl.write (json.dumps (cookies)) 
fl.close() 


上 述 代码 使 用 了 两 次 异常 捕捉 ， 用 于 检测 图 片 验 证 码 和 短信 验证 码 是 否 存在 ， 两 种 验 
证 方式 是 否 出 现 取决 于 百度 账号 的 安全 性 设置 以 及 网 络 环境 等 因素 。 每 个 操作 之 间 都 设置 


116 | _Python 自动 化 开发 实战 


了 强制 性 延 时 ， 这 是 为 了 让 程序 与 网 页 之 间 能 够 同步 协调 。 最 后 完成 整个 登录 操作 后 ， 将 
网 页 的 Cookies 信息 保存 到 txt 文件 。 

得 到 用 户 的 登录 信息 ， 接 下 来 实现 自动 答题 。 整 个 答题 过 程 一 共 涉及 4 个 网 页 : 百度 
知道 问题 列表 页 、 百 度 知道 问题 详情 页 、 答 案 搜 索 页 和 答案 详情 页 。 

在 问题 列表 页 中 ， 每 条 问题 的 HTML 代码 是 由 标签 <a> 生 成 ， 并 且 属 性 class 的 属性 值 
为 title-link， 如 图 8-17 所 示 。 因 此 Selenium 可 以 对 属性 class 进行 定位 ， 获 取 全 部 问题 所 在 
的 标签 <a>， 遍 历 这 些 标签 提取 相应 的 链接 地 址 。 


5 Network Performance Memory Application Security 


em- data-qid="438344135881754364™ data-cid="1249" dara-isfresh data-isthreepoints 


图 8-17 问题 列表 页 


在 新 的 窗口 访问 每 条 问题 链接 ， 这 些 链 接 会 进入 相应 的 问题 详情 页 。 在 问题 详情 页 
中 ， 首 先 判断 问题 是 否 已 被 抢答 ， 如 果 尚 未 被 回答 ， 程 序 根据 题目 去 百度 知道 搜索 相关 的 
答案 ， 在 这 些 相关 答案 中 找到 最 佳 答案 并 且 写 入 问题 答案 输入 框 里 并 单 击 “ 提 交 回 答 ” 按 
钮 ， 如 果 问 题 已 被 回答 ， 程 序 就 关闭 当前 窗口 ， 回 到 问题 列表 执行 下 一 道 问 题 。 问 题 详情 
页 的 答案 输入 框 和 “提交 回答 ”按钮 的 HTML 代码 如 图 8-18 所 示 。 


图 8-18 ”问题 详情 页 


互 


答 问题 的 过 程 中 涉及 到 两 个 新 的 网 页 : 答案 搜索 页 和 答案 详情 页 。 答 案 搜索 页 是 根 
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据 问题 在 新 的 窗口 中 搜索 相关 答案 ， 每 个 答案 的 链接 是 以 标签 <d 必 表示 ， 该 标签 下 含有 标 
签 <a>。 将 Selenium 定位 到 每 个 答案 的 标签 <a>， 再 获取 href 属性 值 ， 该 属性 值 是 用 于 进入 
答案 详情 页 ， 如 图 8-19 所 示 。 


@ httpsy/zhidao.baidu.com/searchzct=17&pn=0&tn=ikaslistam=108fr=wwwt&word=NBA 汉 三 十 年 发 生 了 什么 %2CPython 告 诉 你 


NBA 这 三 十 年 发 生 了 什么 .Python 告诉 你 我 要 提 同 


data-a08- “fm:a5,pos: tl 51:1,5t:0, HitlerNaA 小 有 哪 上 于 六 


图 8-19 ”答案 搜索 页 


将 答案 详情 页 的 链接 在 新 的 窗口 里 访问 ， 每 个 答案 详情 页 都 不 一 定 有 最 佳 答案 ， 根 据 
分 析 可 知 ， 最 佳 答案 的 class 属性 值 为 best-text mb-10， 如 果 Selenium 能 对 属性 class 进行 定 
位 ， 则 说 明 当 前 答案 详情 页 有 最 佳 答案 ， 反 之 则 无 ， 如 图 8-20 所 示 。 

NBA 中 有 也 些 球员 是 23 写 


图 8-20 答案 详情 页 
根据 上 述 的 元 素 定位 以 及 答题 的 业务 逻辑 ， 整 个 答题 程序 需要 注意 每 个 页 面 窗口 之 间 
的 切换 ， 如 果 窗 口 的 切换 逻辑 不 严谨 ， 很 容易 导致 程序 出 错 。 此 外 还 需要 考虑 一 些 异常 的 
情况 出 现 ， 比 如 问题 搜 不 到 任何 答案 、 问 题 已 被 回答 以 及 网 络 延 时 响应 等 一 些 特殊 情况 。 
综合 分 析 ， 自 动 答题 的 功能 代码 如 下 所 示 : 


from selenium import webdriver 
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import json，time 
url = "https://zhidao.baidu.com/1ist?2cid=110" 


driver webdriver .Chrome () 


driver.get (url) 

# 使 用 Cookies 登录 

driver.delete all cookies() 

fl = open('cookie.txt') 

cookie =json.loads (fl1.read()) 

fl.close() 

for c in cookie: 
driver.add _ cookie (c) 


driver.refresh() 


# 获取 问题 列表 
title link = driver.find elements by class name('title-link') 
far dL dn til Linlk: 
# 打开 问题 详细 页 并 切换 窗口 
driver.switch to.window(driver.window_handles[0]) 
href = i.get attribute('href') 
driver.execute script ('window.open("%s");' % (href)) 
time.sleep (5) 
driver.switch to.window (driver.window handles[1]) 
ES 
# 查找 iframe， 判 断 问题 是 否 已 被 回答 
driver.find element by id('ueditor 0') 
# 获取 问题 题目 并 搜索 答案 
title = driver.find element by class name('ask-title ') .text 
title url = "https://zhidao.baidu.com/search?&word=' + title 
js = 'window.open("%s");" $%$ (title url) 
driver.execute script (js) 
time.sleep (5) 
driver.switch to.window (driver.window handles[2]) 
# 获取 答案 列表 
answer list = driver.find _ elements _by_class_name('dt,mb-4,1ine') 
for k in answer list: 
# 打开 答案 详细 页 
href = k.find _ element by tag name('a') .get_attribute('"href') 
driver.execute script('window.open("%s");' 当 (href)) 
time.sleep(5) 


driver.switch to.window (driver.window handles[3]) 
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获取 最 佳 答案 
We 
text = driver.find element by class name ('best-text, 
mb-10') .text 
except: 
text = "'" 
finally: 
# 关闭 答案 详情 页 的 窗口 
driver.close() 
# 答案 不 为 空 
if text: 
# 关闭 答案 列表 页 的 窗口 
driver.switch to.window(driver.window_ handles[2]) 
driver.close() 
# 将 答案 写 在 问题 回答 文本 框 上 并 单 击 提交 答案 按钮 
driver.switch to.window(driver.window_ handles[1]) 
driver.switch to.frame('ueditor 0') 
driver.find element by xpath('/html/body') .click() 
driver.find element by xpath('/html/body') .send keys (text) 
# 跳 回 到 网 页 的 HTML 
driver.switch to.default content () 
# 单 击 提交 回答 按钮 
driver.find element by xpath('//*[@id="answer-editor"] 
/div[2]/a') .click() 
time.sleep (5) 
# 关闭 问题 详细 页 的 窗口 
driver.switch to.window (driver.window handles[1]) 
driver.close() 
break 
except Exception as err: 
# 除了 问题 列表 页 ， 关 闭 其 他 窗口 
all handles = driver.window handles 
for i, Vv in enumerate(all handles): 
i 
driver.switch to.window(v) 
driver.close() 
driver.switch to.window (driver.window handles[0]) 
print (err) 


上 述 代码 多 次 使 用 了 try…except 异常 机 制 ， 这 是 处 理 一 些 特殊 情况 ， 在 某 程度 上 保证 
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了 程序 的 稳健 性 。 程 序 中 涉及 到 4 个 网 页 都 是 使 用 JavaScript 打开 新 的 窗口 ， 使 用 
JavaScript 也 是 为 了 提高 程序 的 稳健 性 ， 因 为 Selenium 的 click() 方 法 没有 JavaScript 稳定 ， 
读者 不 妨 将 JavaScript 的 代码 改 用 click0 方 法 实现 ， 测 试 程序 的 稳定 性 。 


Selenium 是 一 个 用 于 网 站 应 用 程序 自动 化 的 工具 。 它 可 以 直接 运行 在 浏览 器 中 ， 就 像 
真正 的 用 户 在 操作 一 样 。 它 支持 的 浏览 器 包括 正 、Mozilla Firefox、Safari、Google Chrome 
和 Opera 等 ， 同 时 支持 多 种 编程 语言 ， 如 .Net、Java、Python 和 Ruby 等 。 

搭建 Selenium 开发 环境 需要 安装 Selenium 库 并 且 配 置 Google Chrome 的 WebDriver。 
安装 Selenium 库 可 以 使 用 pip 指令 完成 ， 配置 Google Chrome 的 WebDriver 首先 通过 浏览 
器 版 本 确认 WebDriver 的 版 本 ， 然 后 下 载 相应 的 WebDriver 并 存放 在 Python 的 安装 目录 。 

Selenium 定位 网 页 元 素 主要 通过 元 素 的 属性 值 或 者 元 素 在 HTML 里 的 路 径 位 置 ， 定 位 
方式 一 共有 8 种 ， 如 下 所 示 : 

# 通过 属性 id 和 name 来 实现 定位 

find element by id() 

find element by name() 


# 通过 HTML 标签 类 型 和 属性 class 实现 定位 


find element by class name() 


find element by tag name () 


# 通过 标签 值 实现 定位 ，partial_1ink 用 于 模糊 匹配 。 
find element by link text() 

find element by partial link text() 

# 元 素 的 路 径 定位 选择 器 

find element by xpath() 

find element by css_ selector() 


Selenium 可 以 模拟 任何 操作 ， 比 如 单 击 、 右 击 、 拖 拉 、 滚 动 、 复 制 粘 贴 或 者 文本 输入 
等 等 。 操 作 方式 分 为 三 大 类 : 常规 操作 、 鼠 标 事件 操作 和 键盘 事件 操作 。 

Selenium 还 有 一 些 常用 功能 ， 如 设置 浏览 器 的 参数 、 浏 览 器 多 窗口 切换 、 设 置 等 待 时 
间 、 文 件 的 上 传 与 下 载 、Cookies 处 理 以 及 frame 框架 操作 。 


接口 自动 化 开发 


本 章 讲述 如 何 使 用 Requests 实现 网 页 接口 自动 化 开发 ， 利 用 Chrome 分 析 网 站 接口 的 请 
求 信 息 ， 根 据 请 求 信息 使 用 Requests 实现 HTTP 请 求 ， 从 而 实现 网 页 接口 自动 化 开发 。 本 
章 重 点 介绍 了 Requests 模块 的 使 用 ， 如 Requests 的 安装 、 发 送 HTTP 请 求 和 文件 上 存 等 。 


9.1 分 析 网 站 接口 


接口 自动 化 是 通过 查找 网 站 接口 ， 然 后 以 代码 的 形式 来 模拟 浏览 器 来 发 送 请 求 ， 从 而 
与 网 站 服务 器 之 间 实 现 数据 交互 。 在 第 8 章 中 ， 浏 览 器 查找 元 素 是 在 开发 者 工具 的 Element 
标签 页 完成 的 ， 而 网 站 的 接口 查找 与 分 析 是 在 开发 者 工具 的 Network 标签 页 。 

在 Network 标签 页 可 以 看 到 页 面向 服务 器 请 求 的 信息 、 请 求 的 大 小 以 及 加 载 请 求 花 费 
的 时 间 。 从 发 起 网 页 请 求 后 ， 分 析 每 个 HITP 请 求 都 可 以 得 到 具体 的 请 求 信息 (包括 状态 、 
类 型 、 大 小 、 所 用 时 间 、Request 和 Response 等 ) 。Network 结构 组 成 如 图 9-1 所 示 。 

图 上 的 Network 包括 了 5 个 区 域 ， 每 个 区 域 的 说 明 如 下 。 


@ Controls: 控制 Network 的 外 观 和 功能 。 
@ Filters: 将 Requests Table 的 资源 内 容 分 类 显示 。 各 个 分 类 说 明 如 下 : 


回 newoge24z2png 
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图 9-1 Network 结构 图 


* All: 返回 当前 页 面 全 部 加 载 的 信息 ， 就 是 一 个 网 页 全 部 所 需要 的 代码 、 图 片 等 请 求 。 
。 XHR: 筛选 Ajax 的 请 求 链 接 信息 ， 前 面 讲 过 Ajax 核心 对 象 XMLHTTPRequest， 
XHR 取 于 XMLHTTPRequest 的 缩写 。 
* JS: 主要 筛选 JavaScript 文 件 。 
* CSS: 主要 是 CSS 样 式 内 容 。 
* Img: 网 页 加 载 的 图 片 ， 爬 取 图 片 的 URL 都 可 以 在 这 里 找到 。 
* Media: 网 页 加 载 的 媒体 文件 ， 如 MP3、RMVB 等 音频 视频 文件 资源 。 
* Doc: HTML 文件 ， 主 要 用 于 响应 当前 URL 的 网 页 内 容 。 
e@ Overview: 显示 获取 到 请 求 的 时 间 轴 信息 ， 主 要 是 对 每 个 请 求 信息 在 服务 器 的 响应 时 
间 进 行 记 录 。 这 个 主要 是 为 网 站 开发 优化 方面 提供 数据 参考 ， 这 里 不 做 详细 介绍 。 
@。 Requests Table: 按 前 后 顺序 显示 网 站 的 请 求 资源 ， 单 击 请 求 信息 可 以 查看 该 详细 内 容 。 
e@ Summary: 显示 总 的 请 求 数 、 数 据 传输 量 、 加 载 时 间 信 息 。 


在 5 个 区 域 中 ，Requests Table 是 核心 部 分 ， 主 要 作用 是 记录 每 个 请 求 信息 。 但 每 次 网 
站 出 现 刷新 时 ， 请 求 列表 都 会 清空 并 记录 最 新 的 请 求 信息 ， 如 用 户 登 录 后 发 生 304 跳 转 ， 
就 会 清空 跳 转 之 前 的 请 求 信息 并 捕捉 跳 转 后 的 请 求 信息 。 

对 于 每 条 请 求 信息 ， 可 以 单 击 查看 该 请 求 的 详细 内 容 ， 每 条 请 求 信息 划分 为 以 下 5 个 
标签 。 如 图 9-2 所 示 。 
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图 9-2 请 求 信息 的 详细 内 容 


从 图 上 可 以 看 到 ， 一 个 请 求 信息 包含 了 Headers、Preview、Response、Cookies 和 
Timing 标签 。 分 析 接 口 主要 看 Headers、Preview 和 Response 标签 即 可 ， 其 说 明 如 下 。 


@ Headers: 该 请 求 的 HTTP 头 信息 。 
@ Preview: 根据 所 选择 的 请 求 类 型 (JSON、 图 片 、 文 本 ) 显示 相应 的 预览 。 
@ Response: 显示 HTTP 的 Response 信 息 。 


Headers 标签 划分 为 以 下 4 部 分 。 


General: 记录 请 求 链接 、 请 求 方式 和 请 求 状态 码 。 
Response Headers: 服务 器 端的 响应 头 。 其 参数 说 明 如 下 : 


* 


* 


* 


Cache-Control: 指定 缓存 机 制 ， 优 先 级 大 于 Last-Modified。 

Connection: 包含 很 多 标签 列表 ， 其 中 最 常见 的 是 Keep-Alive 和 Close， 分 别 用 于 向 
服务 器 请 求 保持 TCP 连 接 和 断 开 TCP 连 接 。 

Content-Encoding: 服务 器 通过 这 个 头 告诉 浏览 器 数据 的 压缩 格式 。 

Content-Length: 服务 器 通过 这 个 头 告诉 浏览 器 回 送 数据 的 长 度 。 

Content-Type: 服务 器 通过 这 个 头 告诉 浏览 器 回 送 数据 的 类 型 。 

Date: 当前 时 间 值 。 

Keep-Alive: 在 Connection 为 Keep-Alive 时 ， 该 字段 才 有 用 ， 用 来 说 明 服 务 器 估计 保 
留连 接 的 时 间 和 允许 后 续 几 个 请 求 复 用 这 个 保持 着 的 连接 。 

Server: 服务 器 通过 这 个 头 告 诉 浏览 器 服务 器 的 类 型 。 

Vary: 明确 告知 缓存 服务 器 按照 Accept-Encoding 字 段 的 内 容 分 别 缓 存 不 同 的 版 本 。 


Request Headers: 用 户 的 请 求 头 。 其 参数 说 明 如 下 。 


* 


* 


* 


Accept: 告诉 服务 器 客户 端 支持 的 数据 类 型 。 
Accept-Encoding: 告诉 服务 器 客户 端 支持 的 数据 压缩 格式 。 
Accept-Charset: 可 接受 的 内 容 编码 UTF-8。 
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* ”Cache-Control: 缓存 控制 ， 服 务 器 控制 浏览 器 要 不 要 缓存 数据 。 

* ”Connection: 处 理 完 这 次 请 求 后 ， 是 断 开 连接 还 是 保持 连接 。 

* ”Cookie: 客户 可 通过 Cookie 向 服务 器 发 送 数据 ， 让 服务 器 识别 不 同 的 客户 端 

* ”Host: 访问 的 主机 名 。 

* ”Referer: 包含 一 个 URL， 用 户 从 该 URL 代 表 的 页 面 出 发 访问 当前 请 求 的 页 面 ， 当 浏 
览 器 向 Web 服 务 器 发 送 请 求 的 时 候 ， 一 般 会 带 上 Referer， 告 诉 服务 器 请 求 是 从 哪个 
页 面 URL 过 来 的 ， 服 务 器 借 此 可 以 获得 一 些 信 息 用 于 处 理 。 

* User-Agent: 中 文 名 为 用 户 代理 ， 简 称 UA， 是 一 个 特殊 字符 串 头 ， 使 得 服务 器 能 
够 识别 客户 使 用 的 操作 系统 及 版 本 、CPU 类 型 、 浏 览 器 及 版 本 、 浏 览 器 泻 染 引 
学 、 浏 览 器 语言 、 浏 览 器 插件 等 。 


e Query String Parameters: 请 求 参 数 。 将 参数 按照 一 定 的 形式 (GET 和 POST ) 传递 给 服 
务 器 ， 服 务 器 接收 其 参数 进行 相应 的 响应 ， 这 是 客户 端 和 服务 端 进行 数据 交互 的 主要 
遍 式 之 一 . 
Preview 和 Response 标签 的 内 容 是 一 致 的 ， 只 不 过 两 者 的 显示 方式 有 所 不 同 。 如 果 返 
可 的 结果 是 图 片 ， 那 么 Preview 可 显示 图 片 内 容 ，Response 则 无 法 显示 。 如 果 返 回 的 是 
HTML 或 JSON， 那 么 两 者 皆 能 显示 ， 但 在 格式 上 可 能 会 存在 细微 的 差异 。 


9.2 “Requests 概述 及 安装 


Requests 是 Python 的 一 个 很 实用 的 HTTP 客户 端 库 ， 常 用 于 网 络 朴 虫 和 接口 自动 化 测 
试 。 它 语法 简单 易 懂 ， 完 全 符合 Python 优雅 、 简 洁 的 特性 ; 在 兼容 性 上 ， 完 全 兼容 Python 2 
和 Python 3， 具 有 较 强 的 适用 性 。 

Requests 可 通过 pip 安装 ， 有 具体 如 下 。 


e@ Windows 系 统 : pip install requests。 
e Linux 系 统 : sudo pip install requests。 


除了 使 pip 安装 之 外 ， 还 可 以 下 载 whl 文件 -2.18.4-py2.py3-none-anywh 


er 入 < file-1.4.2-py2.py3-none-any.whl 
安装 ， 方 法 如 下 : FE ftp-0.3.1-py2.py3-none-anywhl 


人 BE oauthlib-0.8.0-py2.py3-none-anywhl 
(1) 访 问 www.lfd.uci.edu/~gohlke/pythonlibs， FE toolbelt-08.0-py2 py3-none-anywhl 


按 CtrltF 组 合 键 搜索 关键 字 “requests”， 如 图 9-3 
所 示 图 9-3 requests 安装 包 
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(2) 单 击 下 载 requests2.18.4-py2.py3-none-any.whl， 把 下 载 文件 直接 解压 ， 将 解压 出 
来 的 文件 直接 放 入 Python 的 安装 目录 Lib\site-packages 中 即 可 。 

(3) 除了 解压 whl， 还 可 以 使 用 pip 安装 whl 文件 。 例 如 把 下 载 的 文件 保存 在 EE 盘 ， 
打开 CMD (终端 ， 将 路 径 切换 到 王 盘 ， 输 入 安装 命令 : 


E:\>pip install requests2.18.4-py2.py3-none-any.whl 


完成 Requests 安装 后 ， 在 终端 (CMD) 下 运行 Python， 查 看 Requests 的 版 本 信息 ， 检 
测 是 否 安装 成 功 。 方 法 如 下 : 

E:\>python 

>>> import requests 


>>> requests. Version __ 
20d 


9.3 ”简单 的 请 求 方式 


在 使 用 Requests 向 服务 器 发 送 请 求 之 前 ， 我 们 需要 弄 清楚 几 个 概念 ,请求 是 什么 ? 请 
求 参数 又 是 什么 ? 响应 信息 是 什么 ? 针对 这 三 个 问题 ,具体 解释 如 下 : 


(1) Requests 的 请 求 可 以 理解 为 我 们 平时 在 浏览 器 上 输入 地 址 按 回 车 ， 或 者 在 网 页 上 
单 击 某 个 按钮 、 某 个 链接 等 。 只 要 通过 一 些 操作 使 网 页 内 容 发 生变 化 ， 这 些 操 作 称 之 为 
请 求 。 
(2) 请 求 参数 是 我 们 向 服务 器 发 送 请 求 的 部 分 内 容 ， 一 个 请 求 包含 了 很 多 信息 ， 如 请 
求 头 、Cookies 和 请 求 参 数 等 。 服 务 器 会 根据 请 求 参数 来 选择 不 同 的 响应 内 容 。 
(3) 响应 内 容 是 我 们 发 送 请 求 后 ， 服 务 器 根据 请 求 而 返回 给 我 们 的 数据 。 这 些 数据 通 
是 HIML 代码 或 JSON 数据 ， 然 后 将 数据 通过 浏览 器 泻 染 生成 网 页 。 


了 解 了 网 站 的 一 些 原理 后 ， 接 着 使 用 Requests 发 送 请 求 。 常 用 的 请 求 主要 有 GET 和 
POST， 因 此 ，Requests 也 分 为 两 种 不 同 的 方法 来 实现 。GET 请 求 有 两 种 形式 ， 分 别 是 不 带 
参数 和 带 参数 ， 以 百度 为 例 

不 带 参数 

https://www.baidu.com/ 

# 带 参数 wa 

https://www.baidu.com/s?wd=python 
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判断 URL 是 否 带 有 参数 ， 可 以 对 符号 “?” 判 断 。 一 般 网 址 末端 〈 域 名 ) 带 有 “?”， 


就 说 明 该 URL 是 带 有 请 求 参数 的 ， 反 之 则 不 带 有 参数 。GET 参数 说 明 如 下 : 


(1) wd 是 参数 名 ， 参 数 名 由 网 站 〈 服 务 器 ) 规定 。 
(2) Python 是 参数 值 ， 可 由 用 户 自行 设置 。 
(3) 如 果 一 个 URL 有 多 个 参数 ， 参 数 之 间 用 “&” 连 接 。 


Requests 实现 GET 请 求 ， 对 于 带 参数 的 URL 有 两 种 请 求 方式 : 


import requests 

# 第 一 种 方式 

r= requests.get('https://www.baidu.com/s?wd=python') 
# 第 二 种 方式 

url = 'https://www.baidu.com/s' 

params = {'wd': 'python'} 

# 左边 params 在 GET 请 求 中 表示 设置 参数 

r= requests.get (url, params=params) 

# 输出 生成 的 URL 


print(r.url) 


两 种 方式 都 是 请 求 同 一 个 URL， 在 开发 中 建议 使 用 第 一 种 方式 ， 因 为 代码 简洁 ， 而 且 


参数 可 以 灵活 地 变换 ， 例 如 'https://www.baidu.com/s?wd=%s' %('python')。 


POST 请 求 是 我 们 常 说 的 提交 表单 ， 表 单 的 数据 内 容 就 是 POST 的 请 求 参数 。Requests 


实现 POST 请 求 需 设 置 请 求 参数 data， 数 据 格 式 可 以 为 字典 、 元 组 、 列 表 和 JSON 格式 ， 不 
同 的 数据 格式 有 不 同 的 优势 。 代 码 如 下 : 


# 字典 类 型 

data = {'keyl': "valuel'，'key2': "Value2')} 
# 元 组 或 列表 

(('keyl', "valuel'), ('keyl', 'value2')) 

# JSON 


import json 

data = {'keyl': 'valuel', 'key2': 'value2'} 

将 字典 转换 JSON 

data=json.dumps (data) 

# 发 送 PosT 请 求 

r= requests.post ("https://www.baidu.com/", data=data) 
print (r.text) 
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可 以 看 出 ， 左 边 的 data 是 POST 方法 的 参数 ， 右 边 的 data 是 发 送 请 求 到 网 站 (服务 器 ) 
的 数据 。 值 得 注意 的 是 ，Requests 的 GET 和 了 POST 方法 的 请 求 参数 分 别 是 params 和 data， 
别 混淆 两 者 的 使 用 要 求 。 
当 向 网 站 〔 服 务 器 〉 发 送 请 求 时 ， 网 站 会 返回 相应 的 响应 (response) 对象 ， 包 含 服务 
器 响应 的 信息 。Requests 提供 以 下 方法 获取 响应 内 容 。 


@ .status_code: 响应 状态 码 。 

@ ITIaw: 原始 响应 体 ， 使 用 r.raw.read() 读 取 。 

Icontent: 字 节 方式 的 响应 体 ， 需 要 进行 解码 。 

rtext: 字符 串 方 式 的 响应 体 ， 会 自动 根据 响应 头 部 的 字符 编码 进行 解码 。 
Theaders: 以 字典 对 象 存储 服务 器 响应 头 ， 但 是 这 个 字典 比较 特殊 ， 字 典 键 不 区 分 大 小 
写 ， 若 键 不 存在 ， 则 返回 None。 

rjson(): Requests 中 内 置 的 JSON 解 码 器 。 

r.raise_for_status(): 请 求 失败 ( 非 200 响 应 ) ， 抛 出 异常 。 

r.url: 获取 请 求 链接 。 

r.cookies: 获取 请 求 后 的 cookies。 

e Lencoding: 获取 编码 格式 。 


9.4 复杂 的 请 求 方式 


复杂 的 请 求 方式 通常 带 有 请 求 头 、 代 理 卫 、 证 书 验证 和 Cookies 等 功能 。Requests 将 这 
一 系列 复杂 的 请 求 做 了 简化 ， 将 这 些 功能 在 发 送 请 求 中 以 参数 的 形式 传递 并 作用 到 请 求 中 。 

1. 添加 请 求 头 

请 求 头 以 字典 的 形式 表示 ， 然 后 在 发 送 请 求 中 设置 headers 参数 。 请 求 中 设置 请 求 头 相 
当 于 把 程序 伪装 成 浏览 器 来 向 网 站 发 送 请 求 ， 主 要 设置 User-Agent 和 Referer 的 内 容 ， 因 为 
很 多 网 站 反 息 虫 都 是 根据 这 两 个 内 容 来 判断 当前 请 求 是 否 合法 。 代 码 如 下 : 


headers = { 
'content-type': 'application/json', 
'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64; 
FrV:41.0) Gecko/20100101 Firefox/41.0'} 


requests.get ("https://www.baidu.com/", headers=headers) 
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2. 使 用 代理 IP 

使 用 方法 与 请 求 头 的 使 用 方法 一 致 ， 只 需 设 置 proxies 参数 即 可 。proxies 以 字典 的 形式 
表示 ， 字 和 典 的 key 主要 有 http 和 https， 这 是 两 种 不 同 的 HITP 协议， 字典 的 value 是 一 个 可 
访问 的 瑟 地址 ， 免 费 的 代理 人 P 可 以 网 上 搜索 ， 不 过 很 多 都 是 无 法 使 用 。 代 理 IP 的 实现 代 
码 如 下 : 


import requests 

proxies = { 
hit MEEpa/ OL 
SHEtps "itp U0 L000 


requests.get ("https://www.baidu.com/", proxies=proxies) 


3. 证 书 验 证 

网 站 中 出 现 证 书 不 合法 的 时 候 ， 只 需 设置 verify=False， 等 于 关闭 证 书 验 证 ， 比 如 访问 
12306 的 时 候 ， 若 没有 安装 证 书 就 会 提示 安全 证 书 错误 。 参 数 verify 的 默认 值 为 True。 如 果 
需要 设置 证 书 文件 ， 那 么 可 将 参数 verify 值 设 为 证 书 所 在 的 路 径 。 具 体 代码 如 下 : 


import requests 

url = "https://kyfw.12306.cn/otn/leftTicket/init' 

# 关闭 证 书 验 证 

r= requests.get (url, verify=False) 
print(r.status_ code) 

# 开启 证 书 验 证 

# r = requests.get (url, verify=True) 

# 设置 证 书 所 在 路 径 

# r = requests.get (url, verify= '/path/to/certfile') 


4. 超时 设置 

发 送 请 求 后 ， 由 于 网 络 、 服 务 器 等 因素 ， 从 请 求 到 响应 会 有 一 个 时 间 差 。 如 果 不 想 程 
序 等 待 时 间 过 长 或 者 延长 等 待 时 间 ， 可 以 设 定 参数 timeout 的 等 待 秒 数 ， 超 过 这 个 等 待 时 间 
就 会 停止 等 待 响应 并 引发 一 个 异常 。 使 用 代码 如 下 : 


requests.get ("https://www.baidu.com/", timeout=0.001) 


T 


requests.post ("https://www.baidu.com/", timeout=0.001) 
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5. 使 用 Cookies 


在 请 求 过 程 中 使 用 Cookies 也 只 需 设置 参数 Cookies 即 可 。Cookies 的 作用 是 标识 | 


身份 ， 在 Requests 中 以 字典 或 RequestsCookieJar 对 象 作为 参数 。 获 取 方 式 主要 从 浏览 器 


取 或 通过 程序 运行 产生 。 下 面 的 例子 进一步 讲解 如 何 使 用 Cookies， 代 码 如 下 : 


import requests 
url = 'https://movie.douban.com/' 
temp cookies='JSESSIONID GDS=y4p7osFrOy2N!450649273;name=value' 
cookies dict = {} 
for i in temp cookies.split(';'): 
value = i.split('=') 
cookies dict [value[0]] = value[1] 
r= requests.get (url, cookies=cookies) 
print(r.text) 


读 


代码 中 变量 temp_cookies 代表 Cookies 信息 ， 可 以 在 Chrome 开发 者 工具 一 Network 一 
某 请 求 的 Headers 一 Request Headers 中 找到 Cookie 的 值 。 将 Cookie 信息 由 字符 串 转换 成 字 


典 格式 ， 在 Requests 发 送 请 求 的 时 候 ， 设 置 参 数 cookies 即 可 。 


当 程 序 发 送 请 求 时 ， 在 没有 设置 参数 cookies 的 情况 下 ， 程 序 会 自动 生成 一 


从 


RequestsCookieJar 对 象 ， 该 对 象 用 于 存放 Cookies 信息 。Requests 提供 RequestsCookieJar 


对 象 和 字典 对 象 相互 转换 的 方法 ， 代 码 如 下 : 


import requests 
url = 'https://movie.douban.com/' 


r= requests.get (url) 

# r.cookies 是 RequestsCookieJar 对 象 
Print (r.cookies) 

mycookies = r.cookies 


# RequestsCookieJar 转换 字典 
cookies dict = requests.utils.dict from cookiejar (mycookies) 


print (cookies dict) 


# 字典 转换 RequestsCookieJar 
cookies jar = requests.utils.cookiejar from dict( 
cookies dict, cookiejar=None, overwrite=True) 


print (cookies jar) 


# 在 RequestsCookieJar 对 象 添加 Cookies 字典 中 


print (requests.utils.add dict to cookiejar (mycookies, cookies dict)) 
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如 果 要 将 Cookies 写 入 文件 ， 可 使 用 http 模块 实现 Cookies 的 读 写 。 除 此 之 外 ， 还 可 以 
将 Cookies 以 字典 形式 写 入 文件 ， 此 方法 相 比 http 模块 读 写 Cookies 更 为 简单 ， 但 安全 性 相 
对 较 低 。 使 用 方法 如 下 : 


import requests 

url = "https://movie.douban-com/ 

r= requests.get (url) 

# RequestsCookieJar 转换 字典 

cookies dict = requests.utils.dict from cookie]jar (mycookies) 
# 写 入 文件 

f = open('cookies.txt', 'w', encoding="'utf-8') 

f.writel(str (cookies dict)) 


mh 


.Close() 

# 读 取 文件 

E = open('cookies. txt”, "rr") 

dict value = f.read() 

f.close() 

# eval (dict_value) 将 字符 串 转换 为 字典 

print (eval (dict value)) 

r= requests.get (url, cookies=eval (dict value)) 
print(r.status_ code) 


9.5 ”文件 下 载 与 上 传 


下 载 文 件 主要 从 服务 器 获取 文件 内 容 ， 然 后 将 内 容 保 存 到 本 地 。 下 载 文件 的 方法 如 下 : 


import requests 

url = 'https://dldirl.qq.com/weixin/Windows/WeChatSetup.exe' 
r= requests.get (url) 

f = open('WechatSetup .exe'"， 'wb') 

# r.content 获取 响应 内 容 ( 字 节 流 ) 

f.write(r.content) 

E 


.Close() 


代码 变量 url 是 一 个 EXE 文件 URL 地 址 ， 对 文件 所 在 URL 地 址 发 送 请 求 〈 大 多 数 是 
GET 请 求 方式 ) ; 服务 器 将 文件 内 容 作为 响应 内 容 ， 然 后 将 得 到 的 内 容 以 字 节 流 (Bytes) 
格式 写 入 自 定 义 文件 ， 这 样 就 能 实现 文件 下 载 。 
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除了 文件 下 载 外 ， 还 有 更 为 复杂 的 文件 上 传 ， 文 件 上 传 是 将 本 地 文件 以 字 节 流 的 方式 
上 传 到 服务 器 ， 再 由 服务 器 接收 上 传 内 容 ， 并 做 出 相应 的 响应 。 文 件 上 传 存 在 一 定 的 难 
， 其 难点 在 于 服务 器 接收 规则 不 同 ， 不 同 的 网 站 ， 接 收 的 数据 格式 和 数据 内 容 会 不 一 
致 。 下 面 以 发 送 图 片 微 博 为 例 进行 介绍 。 


1) 在 浏览 器 中 输入 https://weibo.cn/， 在 网 页 上 单 击 “高 级 ”按钮 并 使 用 Fiddler 抓 包 
具 ( 由 于 发 送 微 博时 ， 网 页 发 生 302 跳 转 ， 因 此 使 用 Chrome 会 清空 请 求 信息 ， 导 致 抓 取 
难度 较 大 ) 。 

(2) 单 击 “ 选 择 文件 ”， 选 择 图 片 文件 并 输入 发 布 内 容 “Python 爬虫 ” ， 最 后 单 击 “ 发 
布 ”按钮 发 布 微 博 。 查 看 Fiddler 抓 取 的 请 求 信息 ， 如 图 9-4 所 示 。 


一 


SetCooke: WEIBOCN_FROM=deleted; expires=Thu, 01-Jan-1970 00:00:01 GMT; path=/; domain=,webo.an 
Entity 
Contenttength: 0 


Content-Seaurity Polcy: upgrade-nsecure requests 


图 9-4 Fiddler 抓 包 信息 


从 图 9-4 中 得 知 ， 该 请 求 方式 是 POST，QueryString 是 POST 的 请 求 参数 ，Content-type 
是 上 传 文件 ， 三 个 Content-Disposition 分 别 对 应 微 博 的 发 布 内 容 、 上 传 图 片 和 设置 分 组 可 
见 。 代 码 实现 如 下 : 


url = 'https://weibo.cn/mblog/sendmblog?r1l=0&st=bd6702"' 


Cookties = TTY RX 
files = {'content': (None, 'Python 息 虫 ')，, 
Dic"s. (pile opent test pug "rbr)y 


"image/png')，'visible': (None, '0')} 
r= requests.post (url, files=files, cookies=cookies) 


print(r.status code) 
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POST 数据 对 象 以 文件 为 主 ， 上 传 文件 时 使 用 fles 参 数 作为 请 求 参 数 。Requests 对 提交 
的 数据 和 文件 所 使 用 的 请 求 参数 做 了 明确 的 规定 。 参 数 files 也 是 以 字典 形式 传递 ， 每 个 
Content-Disposition 为 字典 的 键 值 对 ，Content-Disposition 的 name 为 字典 的 键 ，value 为 字 
的 值 。 上 述 代码 设置 了 参数 cookies， 因 为 这 个 图 片上 传 需要 用 户 登 录 才 能 实现 ， 因 此 传 入 
参数 cookies 可 以 实现 用 户 登 录 。 

此 外 ， 不 同 的 网 站 设置 对 files 参数 的 设置 也 是 不 一 样 的 ， 下 面 列 出 较为 常见 的 上 传 
方法 : 

# 单 独 一 个 文件 请 求 

"fieldl" : open("filePathl"，"rb") .read()) 
下 


下 


同时 选中 多 个 文件 
区 
-EredDY se 

("filenamel", open("filePathl", "rb")), 
("filename2", open("filePath2", "rb"), "image/png"), 
open ("filePath3", "rb"), 
open ("filePath4", "rb").read() 
] 


9.6 ”实战 :编写 “12306 车 次 查询 ”程序 


相信 读者 对 Requests 的 使 用 有 了 一 个 大 致 的 了 解 ， 接 下 来 通过 一 个 实例 来 进一步 巩固 
Requests 的 使 用 。 坐 过 火车 的 朋友 都 知道 ， 在 购买 车 票 的 时 候 ， 首 先 查 询 车 票 剩余 量 是 否 
符合 自己 的 出 行 计 划 。 在 12306 的 官网 上 提供 了 余 票 查询 网 址 ， 在 浏览 器 上 代 开 
https:/kyfw.12306.cn/otnleftTicketinit， 如 图 9-5 所 示 。 

查询 车 次 信息 首先 要 输入 出 发 地 、 目 的 地 和 出 发 日 期 ， 完 成 信息 输入 后 ， 单 
询 ” 按 钮 ， 网 站 根据 输入 的 信息 返回 相应 的 车 次 信息 。 

从 一 个 正常 的 车 次 查询 流程 中 发 现 ， 网 站 与 用 户 的 数据 交互 是 在 用 户 单 击 “ 查 询 ” 按 
钮 时 发 生 ， 开 发 者 工具 捕捉 到 的 请 求 信息 如 图 9-6 所 示 。 


和 “ 碍 


缠 
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€ FC a https//kyfw.12306.cn/otn/leftTicket/init 


SEAN 


o410 局 = [ou | on | on | om | ol5 | or16 


车 次 类 型 : 医 于 时 日 GC 高 潜 / 城 三 回 D 动 车 目 z 直 达 怕 T 桂 快 
出 发 本 法: ES 


图 9-5 ”车票 查询 网 页 


Hidedaa URLs 贺 XH 5 css me Media 
x Hesders Previen Response Cookie: 


OD, 


we * Response Headers (9) 


+ Request Headers (11) 

v Query String Parameters er 
leftTicketDTO.train_date: 2019-@4- 
leftTicketDTO.from_station: SH 
leftTicketDTO.to_station: GzQ 
purpose.codes: ADULT 


map: {66Q:“ 广 州 东 "，6ZQ; “广州 "，SHH: “上 海 "，SNH: “上 海南 "}， 
map: 《66Q:“ 广 州 东 "，62Q: “广州 "，SHH: “上 海 "，SNH: “上 海南 "} ,| 


“广州 东 "，6zQ: “广州 "，SHH: “上 海 "，SNH: “上 海南 "} 

[=] 
fMK4tQXK2FbnMFpTYUITwzaMUBp3KMrg2M3wSL6bXzG%2B4UAZ5nAPUGihfYympiz98RdpR6c， 
]xSxRERtSxuYu8VBIX977%2B8%2FxhzTZ8M]5jYeeLYJ%28oekP9vmF%2873oyclpiONLVd 

2: ”3mX2ncxvthThcLenBLakTf]yY%265HsDa4oAVFDCSVGyiixpKE6kzoh%2Bc98D7481U1CVTI 
httpstatus: 299 
messages: "" 
status: true 


图 9-6 车 票 查询 请 求 ( 上 图 ) 及 响应 内 容 (下 图 ) 
但 有 时 候 我 们 会 发 现 ， 车 票 查询 请 求 的 URL 地 址 会 不 定时 地 发 生变 化 ， 主 要 将 图 9-6 
的 query 变 为 queryA。 因 此 ， 在 编写 代码 的 时 候 ， 需 要 分 别 对 两 个 不 同 的 URL 进行 访问 ， 
以 确保 能 获取 车 次 信息 。 如 图 9-7 和 图 9-8 所 示 。 


E Hidedata URls 到 xHR Js CSS Img Media Font Doc WS Mal 


x Headers Preview Response Cookies Timing 


v General 
loading of Request URL: https://kyfm. 12306.cn/otn/1eftrickel /auerya| 
exchange.png odes=ADULT 
Request Method: GET 
Status Code: 售 2900 OK 
Remote Address: 36.258.74.35:443 


Referrer Policy: no-referrer-when-downgrade 


上 Response Headers (7) 


图 9-7 变化 的 URL 地 址 


134 | Python 自动 化 开发 实战 


届 肥 日 2018-08-29 


图 9-8 查询 车 次 信息 
从 图 9-6 的 响应 内 容 与 图 9-8 的 网 页 查询 车 次 信息 对 比 可 以 发 现 ， 两 者 的 数据 是 可 以 相 
互 匹配 的 ， 网 页 上 的 车 次 信息 由 图 9-6 的 响应 内 容 按 照 某 种 方式 泻 染 到 网 页 上 。 也 就 是 
说 ， 图 9-6 的 响应 内 容 就 是 我 们 需要 的 目标 数据 。 
目 Hide data URLs Al xHR 园 css Img Media Font Doc Ws Manifest other 


Name X Headers | Preview | Response Timing 


加 datajcokiesjs var station_names =" 凶 jb| 北 京北 |vap |beijingbei|bjb|o8bjd| 
queryLeftTicket jsjs?scriptVersion=1.9043 

[jquery.bgiframe.mijs 
newjs 

转 station_namejs?station_version=1.9028 

DD favorite namejs 
queryLeftTicket_end_UAM_jsjs?scriptVersion. | 


口 aofy | 


可 datajcalendarjs 图 


口 captdha jsjs 


eventis 
14/ 126 requests | 5.8 KB / 102 KB transferred |... 


图 9-9 各 个 城市 信息 
想 要 得 到 车 次 信息 ， 首 先 使 用 Requests 模拟 浏览 器 先 网 站 服务 器 发 送 请 求 。 从 图 9-6 
的 请 求 信 息 可 以 看 到 ， 这 个 请 求 方式 是 一 个 GET 请 求 ， 并 且 有 4 个 参数 ， 从 参数 的 命名 可 
以 知道 : 


(1) leftTicketDTO train_ date 是 车 次 出 发 日 期 。 
(2) leftTicketDTO.from station 是 出 发 地 。 

(3) leftTicketDTO.to_station 是 目的 地 。 

(4) purpose_codes 是 固定 值 。 
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在 4 个 参数 中 ， 唯 独 出 发 地 和 目的 地 无 法 确定 真实 数据 ， 两 者 都 是 由 三 位 英文 字母 组 
成 ， 前 两 个 字母 由 城市 名 的 拼音 首 字母 组 成 ， 最 后 一 个 字母 无 法 确认 。 但 每 个 城市 的 英文 
编号 是 唯一 的 ， 如 出 发 地 为 广州 ， 那 么 它 的 请 求 参数 必须 为 GZQ。 

我 们 尝试 刷新 网 页 ， 在 网 页 中 查找 其 他 请 求 信息 ， 是 否 在 其 他 的 请 求 信息 中 找到 城市 
的 英文 编号 。 刷 新 网 页 后 ， 在 某 个 请 求 中 找到 城市 编号 信息 ， 见 图 9-9。 

观察 图 上 的 数据 结构 ， 发 现 每 个 城市 之 间 以 “@” 为 一 个 开始 点 ， 那 么 每 个 城市 以 
“@” 分 组 处 理 ， 每 一 组 中 ， 再 以 “|” 分 组 处 理 。 经 过 两 次 分 组 ， 我 们 可 以 提取 城市 名 以 及 
城市 编号 ， 实 现代 码 如 下 所 示 : 


import requests 


def city name () : 
url = 'https://kyfw.12306.cn/otn/resources/js/ 
framework/station name.js?station version=1.9063' 
city code = requests.get (url) 
city code list = city code.text.split("|") 
citypoket = {3 
for k, i in enumerate(city code list): 
££ "er Tn: Ls 
# 城市 名 作为 字典 的 键 ， 城 市 编号 作为 字典 的 值 
city dict[city code list[k + 1]] = city code list[k + 2] 
return city dict 


现在 可 以 根据 城市 名 来 确定 城市 编号 ， 也 就 说 我 们 确定 了 图 9-6 的 请 求 参数 ， 已 经 可 
以 使 用 Requests 来 获取 车 次 信息 。 但 从 响应 内 容 发 现 ， 每 班 的 车 次 信息 也 是 使 用 "|? 隔 开 ， 
在 这 样 的 数据 中 提取 有 效 的 信息 也 是 将 “|” 分 组 处 理 ， 然 后 根据 数据 的 序列 进行 提取 。 整 
个 功能 的 代码 如 下 : 


import requests 


def city name(): 
url = 'https://kyfw.12306.cn/otn/resources/js/ 
framework/station name.js?station version=1.9063' 
city code = requests.get (url) 
city code list = city code.text.split ("|") 
CE = 
for k, i in enumerate(city code list): 
5 Se i 
斐 城市 名 作为 字典 的 键 ， 城 市 编号 作为 字典 的 值 
city dictleity code Listlie * 11] = city code listlk 2 


return city dict 


136 | Python 自动 化 开发 实战 


def get infol(train date, from station, to station): 

# 将 城市 名 转换 成 城市 编号 

city dict = city name() 

from station = city dict[from station] 

to station = city dict[to station] 

# 发 送 请 求 

params = { 
'leftTicketDTO.train date': train date, 
'leftTicketDTO.from station': from station, 
'leftTicketDTO.to station': to station, 
'purpose codes': "ADULT" 

} 

# 通过 try.….except 方式 分 别 对 不 同 的 URL 进行 访问 

SR 
url = 'https://kyfw.12306.cn/otn/leftTicket/query' 
r= requests.get (url, params=params) 
info text = r.json()['data']['result'] 

except: 
url = 'https://kyfw.12306.cn/otn/leftTicket/queryaA' 
r= requests.get (url, params=params) 
info text = r.json()['data']['result'] 

# 获取 响应 内 容 并 提取 有 效 数据 

info list = [] 

for i in info text: 
info dict = {} 
train info = i.split('|') 
info dict['train no'] = train_info[3] 
info dict['start time'] = train info[8] 
info dict['end time'] = train info[9] 
info dict['interval time'] = train info[10] 
info dict['second seat'] = train info[30] 
info dict['frist seat'] = train info[31] 
info dict['special seat'] = train info[32] 
info list.append(info dict) 

return info list 


了 name = " main ': 
train date = '2018-10-29' 
from station = "广州 ' 
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to station 三 到 武汉 "” 
info = get infol(train date, from station, to station) 


print (str (info)) 


9.7 ”本章 小 结 


接口 自动 化 是 通过 查找 网 站 接口 ， 然 后 以 代码 的 形式 来 模拟 浏览 器 来 发 送 请 求 ， 从 而 
与 网 站 服务 器 之 间 实 现 数 据 交 互 。 
Requests 是 Python 的 一 个 很 实用 的 HITP 客户 端 库 ， 常 用 于 网 络 怜 虫 和 接口 自动 化 测 
试 。 它 语法 简单 易 懂 ， 完 全 符合 Python 优雅、 简洁 的 特性 ; 在 兼容 性 上 ， 完 全 兼容 Python 
2 和 Python 3， 具 有 较 强 的 适用 性 。 
在 使 用 Requests 开发 接口 自动 化 之 前 ， 必 须 掌 握 使 用 浏览 器 的 开发 者 工具 去 分 析 网 站 
接口 。 所 有 的 接口 信息 都 在 Network 标签 页 ， 可 以 看 到 页 面向 服务 器 请 求 的 信息 、 请 求 的 
大 小 以 及 加 载 请 求 花费 的 时 间 。 从 发 起 网 页 请 求 后 ， 分 析 每 个 HITP 请 求 都 可 以 得 到 具体 
的 请 求 信息 〈 包 括 状态 、 类 型 、 大 小 、 所 用 时 间 、Request 和 Response 等 ) 。 

常用 的 请 求 主要 有 GET 和 POST，Requests 分 为 两 种 不 同 的 方法 来 实现 请 求 ， 完 整 的 
请 求 方式 如 下 : 


requests.get (url, params, headers, proxies, verify=True, cookies) 
requests.post (url, params, headers, proxies, verify=True, cookies, files) 


接口 自动 化 开发 也 可 以 称 为 网 络 爬 虫 开 发 ， 两 者 实现 的 方法 和 原理 都 是 相同 的 。 如 果 
读者 对 网 络 朴 由 有 兴趣 可 以 关注 笔者 的 《 玩 转 Python 网 络 爬 虫 》 一 书 。 


| 


系统 自动 化 开发 


本 章 讲述 如 何 使 用 PyAutoGUI 实 现 系统 自动 化 开发 ， 通 过 PyAutoGUI 控 制 计 算 机 的 鼠 
标 和 键盘 的 操作 ， 达 到 系统 自动 化 的 目的 。PyAutoGUI 可 以 实现 计算 机 所 有 的 自动 化 开 
发 ， 它 是 通过 图 像 的 简单 识别 进行 定位 ， 再 由 鼠标 或 键盘 对 定位 位 置 进行 操作 ， 从 而 实现 
自动 化 操作 。 


10.1 PyAutoGUI 概述 及 安装 


PyAutoGUI 是 一 个 纯 Python 开发 的 跨 平 台 GUI 自动 化 工具 ， 它 是 通过 程序 来 控制 计算 
机 的 键盘 和 鼠标 的 操作 ， 从 而 实现 自动 化 功能 。 所 谓 的 GUI 是 指 图 形 用 户 界面 ， 即 通过 图 
形 方式 来 显示 计算 机 的 界面 ， 早 期 的 计算 机 是 以 命令 行 界面 来 操作 ， 其 中 Linux 服务 器 版 本 
仍 在 使 用 ， 而 日 常 工作 中 使 用 的 Windows、Mac 和 Linux 桌面 发 行 版 都 是 以 GUI 来 显示 。 
PyAutoGUI 一 共 分 为 三 大 功能 : 鼠标 操控 、 键 盘 操 控 和 截图 识别 ， 三 者 可 以 相互 协调 
使 用 。 截 图 识别 可 以 为 计算 机 提供 简单 的 视觉 功能 ， 让 PyAutoGUI 在 计算 机 上 找到 某 个 按 
钮 或 某 个 图 标的 坐标 位 置 ， 然 后 操作 鼠标 或 键盘 来 实现 自动 化 控制 。 
PyAutoGUI 的 使 用 范围 相当 广泛 ， 只 要 计算 机 能 运行 的 GUI 程序 都 可 以 控制 ， 正 因 如 
此 ， 程 序 在 执行 过 程 中 ， 如 果 人 为 操作 鼠标 和 键盘 都 会 对 程序 的 执行 造成 一 定 的 影响 ， 也 
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就 是 说 ，PyAutoGUI 开发 的 自动 化 程序 在 稳定 性 方面 是 比较 薄弱 的 。 

在 不 同 的 平台 ，PyAutoGUI 的 安装 步骤 有 所 不 一 样 。 在 不 同 平台 安装 PyAutoGUI， 可 
能 需要 安装 一 些 依赖 模块 ， 具 体 的 安装 方法 如 下 。 

ee Windouws 系 统 : 无 需 安装 依赖 模块 ， 在 CMD 上 运行 pip install pyautogui 即 可 完成 安装 。 

ee Linux 系 统 : 首先 安装 的 4 个 依赖 模块 ， 最 后 安装 PyAutoGUI， 安 装 指令 如 下 : 


sudo pip3 install python3-xlib 
sudo apt-get install scrot 

sudo apt-get install python3-tk 
sudo apt-get install python3-dev 
sudo pip3 install pyautogui 


eMac OS X 系 统 : 安装 pyobjc 模 块 再 安装 PyAutoGUI， 安 装 指令 如 下 : 


pip3 install pyobjc-core 
pip3 install pyobjc 
pip3 install pyautogui 


完成 PyAutoGUI 的 安装 ， 我 们 在 终端 进入 Python 的 交互 模式 ， 验 证 模块 安装 是 否 成 
功 ， 验 证 方法 如 下 : 

C:\Users\000>python 

>>> import pyautogui 


>>> pyautogui. version _ 
A 


10.2 截图 与 识别 


PyAutoGUI 有 特定 的 方法 来 截取 计算 机 的 屏幕 ， 获 取 屏 幕 快照 。 屏 幕 快照 是 RGB 模式 
的 图 像 ，RGB 模式 是 图 片 的 色彩 模式 ，R 代表 Red (红色 ) ，G 代表 Green (绿色 ) ，B 代 
表 Blue〈 蓝 色 ) ， 自 然 界 中 肉眼 所 能 看 到 的 任何 色彩 都 可 以 由 这 三 种 色彩 混合 倒 加 而 成 。 
在 Python 里 面 ，RGB 颜色 数值 是 一 个 长 度 为 3 的 元 组 ， 如 (62, 59, 55) ，62 代表 红色 
的 深浅 程度 ，59 代表 绿色 ，55 代表 蓝 色 ， 每 种 颜色 的 数值 范围 是 0 到 255。 
台 计 算 机 的 屏幕 分 辩 率 都 是 不 同 的 ， 因 此 屏幕 快照 的 分 辨 率 也 不 同 。 屏 幕 分 辨 率 是 
屏幕 上 显示 的 像素 个 数 ， 分 辨 率 160x128 的 意思 是 水 平方 向 含有 像素 数 为 160 个 ， 垂 直方 
向 像素 数 128 个 。 屏 幕 尺 寸 一 样 的 情况 下 ， 分 辩 率 越 高 ， 显 示 效 果 就 越 精细 和 细腻 。 通 俗 
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点 理解 ， 在 一 张 图 片 里 面 ， 像 素数 可 以 比喻 成 一 个 点 ， 这 个 点 的 颜色 是 RGB 模式 ， 那 么 多 
个 点 可 以 组 成 一 条 线 ， 多 条 线 可 以 组 成 一 个 面 ， 而 这 个 面 就 代表 这 张 图 片 。 如 图 10-1 所 示 。 

了 解 了 图 像 的 基本 原理 后 ， 这 个 原理 会 对 我 们 后 续 的 开发 有 很 大 的 帮助 和 指导 。 回 到 
PyAutoGUI， 想 通过 它 来 获取 屏幕 快照 ， 可 以 调用 screenshot0 函 数 ， 在 PyCharm 或 Python 
交互 模式 下 输入 以 下 代码 ， 


import pyautogui 
im = pyautogui.screenshot (imageFilename='screenshot .png') 


运行 代码 ，PyAutoGUI 会 自动 将 计算 机 当前 的 屏幕 进行 全 屏 截 图 ， 并 保存 命名 为 
screenshotpng 文件 ， 我 们 查看 图 片 screenshotpng 的 属性 信息 ， 可 以 看 到 图 像 分 辨 率 为 
1920X1080， 这 个 分 辩 率 也 是 计算 机 的 分 辩 率 。 如 图 10-2 所 示 。 


= screenshotpng 属性 


江 规 。 安全 。 详细 信息 以 前 的 版 本 


1920x1080 
1920 保 素 
1080 像 宗 
24 


1919，1079 


图 10-1 屏幕 分 辨 率 图 10-2 图 像 属性 
如 果 不 想 对 计算 机 全 屏 截 图 ， 可 以 在 screenshot0 函 数 传 入 参数 region 来 设置 截图 坐 


标 ， 坐 标 以 平面 坐标 表示 ， 分 为 X 坐标 和 YY 坐标。 参数 region 是 一 个 长 度 为 4 的 元 组 ， 元 
组 每 个 元 素 依次 代表 : X 坐标 起 点 、Y 坐标 起 点 、X 坐标 终点 和 YY 坐标 终点 。 有 具体 的 示例 
代码 如 下 : 


import pyautogui 

# region = (X 坐标 起 点 ，Y 坐标 起 点 ，X 坐标 终点 ，Y 坐标 终点 ) 
region = (0, 100, 300, 400) 

name = 'screenshot .png' 


im = pyautogui .screenshot (region=region, imageFilename=name) 


上 述 例 子 都 是 讲述 计算 机 屏幕 的 截图 功能 ， 接 下 来 讲述 图 像 的 简单 识别 。PyAutoGUI 
的 图 像 识别 是 通过 图 片 的 分 辨 率 查找 该 图 片 在 计算 机 屏幕 里 所 在 的 坐标 位 置 ， 图 像 识 别 调 
用 locateOnScreen(0) 函 数 即 可 实现 ， 函 数 参 数 image 是 目标 图 片 ， 用 于 匹配 计算 机 屏幕 ， 目 
标 图 片 必须 为 PNG 格式 ， 如 果 是 卫 G 格式 ，PyAutoGUI 是 无 法 识别 。 因 为 PG 格式 会 对 图 
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片 进行 有 损 压 缩 处 理 ， 从 而 改变 图 像 原 有 的 分 辨 率 ， 导 致 识别 失败 。locateOnScreen0 函 数 的 


使 


如 QQ 截图 ) 截取 计算 器 的 数字 5， 截 取 后 的 图 
片 保存 为 targetpng 文件 ， 在 运行 上 述 代码 之 


前 ， 


运行 结果 可 以 看 到 ， 坐 标 位 置 是 一 个 长 度 为 4 的 
元 组 ， 元 组 的 每 个 元 素 依次 代表 : X 坐标 起 点 、 
YY 化 标 起 点 、X 坐标 偏 移 量 和 YY 坐标 偏 移 量 ， 如 


方法 如 下 : 


import pyautogui 
location = pyautogui.locateOnscreen (image='target .png') 
print (location) 


以 计算 机 的 计算 器 为 例 ， 使 用 截图 工具 〈 比 1 画 5NT-epy [ID] yeharm 


Ble Edit View Navigate Code Refa 


必须 保证 计算 器 显示 在 当前 屏幕 。 从 程序 的 


图 10-3 所 示 。 图 10-3 locateOnScreen 识别 图 像 


化 。 


图 像 坐标 并 非 一 成 不 变 ， 计 算 器 在 计算 机 的 显示 位 置 不 同 ， 它 的 坐标 位 置 也 随 之 变 
图 上 的 坐标 位 置 和 和 立 是 起 始 位 置 ， 也 就 是 目标 图 像 的 最 左上 方 的 坐标 位 置 ， 如 果 想 


获取 目标 图 像 的 中 心 坐 标 位 置 ， 可 以 使 用 center0 或 locateCenterOnScreen0) 函 数 获取 ， 根 据 
上 述 示 例 ， 获 取 中 心 坐标 位 置 的 代码 如 下 : 


import pyautogui 

# center () 函数 

location = pyautogui.locateOnscreen (image='target .png') 
x, y = pyautogui .center (location) 

print ('center () 函数 : '，x,，y) 

# 输出 256 368 


# locateCenteronscreen () 函数 

x, y = pyautogui.locateCenteronscreen (image='target .png') 
print ('locateCenteronscreen() 函数 : '，x, y) 

# 输出 256 368 


上 述 代 码 输 出 的 XY 坐标 与 图 10-2 对 比 发 现 ， 图 10-2 的 中 心 位 置 X 坐标 为 


237+38/2=256， 而 上 述 代码 输出 的 X 坐标 也 是 236， 显 然 center0 和 locateCenterOnScreen() 


函数 都 能 直接 得 到 目标 图 像 的 中 心 位 置 ， 无 需 通过 计算 获取 。 


像 ， 


如 果 计 算 机 屏幕 上 有 多 个 目标 图 像 ， 而 locateOnScreen0 函 数 只 能 识别 到 第 一 个 目标 图 
却 无 法 识别 全 部 目标 图 像 。 为 了 解决 这 个 问题 ， 可 以 使 用 locateAllOnScreen0 函 数 来 识 


别 全 部 目标 图 像 的 坐标 位 置 ， 具 体 使 用 方法 如 下 : 
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import pyautogui 


location = pyautogui.locateAllOnscreen (image='target .png') 


for i in location: 
print (i) 


在 计算 机 上 打开 多 个 计算 器 ， 目 标 图 像 依然 是 计算 器 的 数字 5，locateAllOnScreen0 函 
数 查找 目标 图 像 的 顺序 是 从 上 到 下 ， 从 左 到 右 。 运 行 上 述 代码 并 查看 识别 结果 ， 如 图 10-4 


所 示 。 


Mc || wa || ws|| ws | 


四 四 四 四面 


D:\Python\python, exel 
(296, 
(509, 
(458, 


509，40，33) 
509，40，33) 
776，40，33) 
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图 10-4 locateAllOnScreen 识别 图 像 


除 此 之 外 ，PyAutoGUI 还 提供 了 灰 度 匹配 和 像素 匹配 。 灰 度 


匹配 是 在 locate 函数 〈 如 


locateOnScreen、locateCenterOnScreen 或 locateAllOnScreen ) 设 置 参数 grayscale=True 即 可 ， 


它 能 加 快 定位 速度 ， 但 会 降低 识别 的 准确 率 。 


像素 匹配 可 以 使 用 pixel0 或 getpixel0 函 数 来 获取 某 个 分 辨 率 的 RGB 颜色 数值 ， 再 由 


PixelMatchesColor0 函 数 实现 颜色 匹配 。 有 具体 示例 如 下 所 示 : 


import pyautogui 

from pyautogui import pixelMatchesColor 

# 获取 坐标 点 (100，200) 的 RGB 数值 

pix = pyautogui .pixel (100, 200) 

print (' 坐 标点 (100，200) 的 RGB 颜色 数值 : '，pix) 

# 坐标 点 (100，200) 的 RGB 数值 与 pix 匹配 

matches_1 = pixelMatchesColor (100，200，Pix) 

# 坐标 点 (100，200) 的 RGB 数值 与 RGB 数值 (62，59，59) 匹配 
# tolerance 设置 每 个 颜色 的 误差 值 


matches 2 = pixelMatchesColor (100, 200, (62, 59, 59), tolerance=10) 
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10.3 鼠标 控制 功能 


鼠标 的 功能 主要 有 移动 、 拖 动 和 单 击 ， 这 也 是 我 们 日 常 操控 鼠标 的 基本 动作 。 


PyAutoGUI 实现 鼠标 的 控制 离 不 开具 体 的 坐标 位 置 ， 比 如 将 鼠标 移动 到 某 个 地 方 ， 那 么 


PyAutoGUI 需要 知道 这 个 地 方 的 具体 坐标 位 置 才能 操控 鼠标 移动 。PyAutoGUI 提 供 了 size0 


函数 
法 如 


本 质 
是 根 


个 像 
目标 


表示 


到 桌 
前 鼠 
置 。 


和 position0， 这 两 个 函数 可 用 于 获取 屏幕 分 辨 率 大 小 和 鼠标 当前 的 XY 坐标 。 使 用 方 
Rs 


import pyautogui 

screen = pyautogui.size() 
Print (' 屏 幕 分 辩 率 ; '，screen) 
mouse = pyautogui.position() 


print (' 鼠标 当前 位 置 '，mouse) 
鼠标 的 移动 可 以 使 用 moveTo0 或 moveRel0 函 数 来 实现 ， 虽 说 两 者 都 能 移动 鼠标 ,但 


上 也 有 一 定 的 区 别 。moveTo0 函 数 是 将 鼠标 移动 到 固定 某 个 坐标 位 置 ，moveRel0) 函 数 
据 鼠 标的 当前 位 置 进行 偏 移 移 动 。 两 者 的 使 用 方法 如 下 : 


import pyautogui 

# 将 鼠标 移动 到 (10，10) 

pyautogui .moveTo (x=10, y=10, duration=3) 

# 当前 鼠标 位 置 向 xX 坐标 偏 移 100，Y 坐标 偏 移 80 
pyautogui .moveRel (xOffset=100, yOffset=80, duration=3) 


moveTo() 的 参数 分 别 代 表 XX 坐标 、Y 坐标 和 移动 时 间 。X 坐标 和 YY 坐标 代表 屏幕 上 某 
素 点 的 坐标 位 置 ， 移 动 时 间 duration 默认 值 为 0， 若 duration 为 0， 鼠 标 会 瞬间 移动 到 
位 置 ， 当 duration 大 于 0， 可 以 清晰 地 看 到 鼠标 移动 的 轨迹 。 
moveRel() 的 参数 分 别 代 表 X 坐标 偏 移 量 、Y 坐标 偏 移 量 和 移动 时 间 。X 坐标 偏 移 量 可 
正 数 或 负数 ， 正 数 代 表 向 右 偏 移 ， 负 数 代表 向 左 偏 移 ， 同 理 ，Y 坐标 偏 移 量 若 为 正 数 
向 下 偏 移 ， 负 数 表示 向 上 偏 移 ， 移 动 时 间 duration 与 moveTo0 的 duration 是 同一 个 功能 。 
默认 情况 下 ， 鼠 标的 拖 动 是 长 按 鼠 标 左 键 并 发 生 移动 ， 比 如 将 桌面 上 的 软件 图 标 拖拉 
而 的 其 他 位 置 。PyAutoGUTI 的 拖 动 功能 由 dragTo0 和 dragRel0 实 现 ，dragTo0 是 根据 当 
标的 位 置 拖 动 到 某 个 坐标 位 置 ;， dragRel0 是 根据 当前 鼠标 的 位 置 拖 动 到 某 个 偏 移 位 
具体 使 用 方法 如 下 : 
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import pyautogui 

# 先 移动 鼠标 到 (50, 50) 

pyautogui .moveTo (x=50, y=50, duration=3) 

# 鼠标 在 坐标 (50, 50) 进行 拖拉 ， 拖 拉 目 的 位 置 (500，500) 

pyautogui .dragTo (x=500, y=500, duration=2, button='left') 

# 鼠标 在 坐标 (500，500) 拖拉 偏 移 量 (-450，-450) ， 即 回 到 (50,50) 

pyautogui .dragRel (xOffset=-450, yOffset=-450, duration=2, button='left') 


上 述 代 码 是 将 计算 机 最 上 方 的 图 标 拖 


拉 到 目的 位 置 (500, 500)， 然 后 再 将 图 标 拖 py 
回 到 原来 的 位 置 。 为 了 更 好 地 体现 效果 ， 小 加 标 (N) 
运行 程序 之 前 ， 在 电脑 桌面 上 某 个 空白 地 A 
方 右键 选择 “查看 ”一 取消 “自动 排列 图 人 = 
标 ” 一 取消 “将 图 标 与 网 格 对 齐 ”， 如 图 
10-5 所 示 。 国 005 守 罗 交 于 
鼠标 的 单 击 由 click0 函 数 实现 ， 该 函数 包含 了 鼠标 的 单 击 、 双 击 、 按 键 类 型 ( 左 键 或 右 


键 


ish 


、 单 击 间隔 以 及 单 击 的 坐标 位 置 。clickO 函 数 的 说 明 及 使 用 如 下 : 


# clLick (x=None，yY=None，clicks=1，interval=0.0，button='left'，duration=0.0) 
x 和 Y 代表 坐标 位 置 
clicks 代表 单 击 次 数 
interval 单 击 间隔 
button 设置 单 击 右键 或 左 键 ， 参 数值 可 以 设置 left 或 right 
duration 移动 坐标 位 置 的 移动 时 间 
pyautogui.click (x=50, y=50, clicks=2, interval=0.25, button='left') 
此 外 ， 还 有 鼠标 的 一 些 常 用 操作 ， 如 滚动 ， 左 键 或 右键 的 长 按 与 释放 ， 有 具体 使 用 方式 
如 下 : 
import pyautogui 
# 参数 clicks 为 正 数 代表 鼠标 向 上 滚动 ， 负 数 代 表 向 下 滚动 
pyautogui.scroll (clicks=10) 
# 长 按 右 键 
pyautogui .mouseDown (button='right') 


# 移动 到 (100，200) 再 释放 右键 
pyautogui .mouseUp (button='Tight'，Xx=100，Y=200) 


提亲 六 韩 韩 
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10.4 ”键盘 控制 功能 


PyAutoGUI 控制 键盘 操作 主要 有 文本 输入 、 按 键 长 按 与 释放 以 及 热 键 组 合 使 用 ， 三 种 
操作 都 由 不 同 的 函数 实现 。 文 本 输入 由 typewrite0 函 数 实现 ， 按 键 的 长 按 与 释放 分 别 由 
keyDown0 和 keyUp0 函 数 实现 ， 热 键 组 合 使 用 是 由 hotkey0O 函 数 实现 。 

typewrite0) 函 数 是 根据 当前 活动 的 窗口 来 输入 文本 内 容 ， 也 就 说 当前 鼠标 的 光标 在 
儿 ， 文 本 就 从 哪儿 输入 。 但 typewrite0 只 能 输入 英文 字母 ， 无 法 输入 中 文 内 容 ， 如 果 是 中 
英 结合 的 文本 内 容 ， 它 也 只 能 输出 英文 部 分 。typewrite0) 函 数 的 使 用 如 下 : 

import pyautogui 


# interval 设置 文本 输入 速度 ， 默 认 值 为 0 
pyautogui .typewrite (' 你 好 ! Python'，interval=0.5) 


typewriteO) 函 数 一 般 要 结合 鼠标 单 击 函 数 click0 使 用 ，click0 函 数 用 于 激活 文本 框 ， 如 
文件 的 文本 框 或 网 页 的 文本 框 等 这 类 文本 控件 ， 当 文本 框 被 激活 后 ，typewrite0 函 数 就 模 
拟 键盘 向 文本 框 输入 内 容 。 

键盘 的 按键 长 按 与 释放 与 鼠标 的 长 按 与 释放 是 同一 个 原理 ， 按 键 长 按 可 使 得 键盘 的 某 
个 按键 处 于 被 按 下 的 状态 ， 按 键 释放 是 将 被 按 下 的 按键 释放 出 来 。 我 们 使 用 keyDownO 和 
keyUp0O 函 数 实 现 快 捷 键 开启 任务 管理 器 ， 具 体 代码 如 下 : 


import pyautogui 


pyautogui.keyDown('ctrl') 

pyautogui .keyDown ('shift') 

pyautogui .keyDown ('esc') 

pyautogui .keyUp('esc') 

pyautogui .keyUp('shift') 

pyautogui.keyUp('ctrl') 

快捷 键 开 启 任务 管理 器 需要 同时 按 下 Ctrl+ShifttEsc 按键 ， 而 keyDown0 和 keyUp0 函 数 
参数 是 代表 键盘 上 某 个 按键 ， 当 然 也 可 以 传 入 文本 内 容 ， 只 不 过 程序 不 会 有 任何 操作 而 已 。 

热 键 是 一 种 按键 组 合 ， 它 能 使 用 或 运行 计算 机 上 的 某 些 功能 ， 如 常用 的 复制 《Ctrl+C) 
粘贴 CCtrlHV) 。 所 有 的 按键 组 合 都 可 以 使 用 keyDown0 和 keyUp0 函 数 实 现 ， 只 不 过 代码 
量 较 多 ， 若 是 遇 到 多 种 按键 组 合 ， 代 码 就 显得 相当 复杂 。 因 此 ，PyAutoGUI 提供 了 hotkey0 
函数 ， 只 需 将 各 种 按键 组 合 写 入 函数 即 可 实现 ， 以 上 述 开 启 任 务 管理 器 为 例 ，hotkey0 函 数 
的 代码 如 下 : 
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import pyautogui 
pyautogui.hotkey('ctrl', 'shift', 'esc') 


不 管 是 keyDown()、keyUp0 或 hotkey0 函 数 ， 函 数 参 数 key 都 是 代表 键盘 上 某 个 按键 或 
组 合 按键 ， 并 且 按 键 都 是 以 字符 串 表示 ， 对 于 一 些 特殊 功能 的 按键 ，PyAutoGUI 已 有 相应 
的 定义 ， 如 keyUp(esc)， 字 符 串 esc 就 代表 键盘 上 的 Esc 键 。PyAutoGUI 对 特殊 功能 的 按 
键 定 义 如 图 10-6 所 示 。 


'altleft' 
"browserfavorit' 


» “insert’, "junja’, 


launchmed 
“nonconm 
num7", 
， "prevtraci 
，*return"， "| "separator "， 
left', ‘shiftright', “sleep , subtract , “tab’, 
lumedonn' , 'volumemute’, ‘volumeup’, win', ‘winleft’, ‘winright’, ‘yen’, 
， ‘option', “optionleft’, ‘optionright"] 


图 10-6 特殊 功能 按键 


10.5 ”消息 框 功 能 


PyAutoGUI 引用 PyMsgBox 模块 的 消息 框 函 数 来 实现 4 种 不 同类 型 的 消息 框 ，alert、 
confirm、prompt 和 password。4 种 消息 框 的 说 明 如 下 。 
@ alert: 带 有 文本 信息 和 单个 按钮 的 简单 消息 框 。 参 数 text、title 和 button 分 别 设置 文本 内 
容 、 提 示 框 的 标题 以 及 按钮 的 命名 ， 使 用 方法 如 下 : 


import pyautogui 

msg = pyautogui.alert (text=' 这 是 alert! ', title='Alert', button='OK') 

# msg 的 值 为 button 的 值 。 

print (msg) 

@ confirm: 带 有 文本 信息 和 多 个 按钮 的 消息 框 。 参 数 text、title 和 buttons 分 别 设置 文本 内 
容 、 提 示 框 的 标题 以 及 自 定义 按钮 ， 参 数 buttons 以 列表 表示 ， 可 以 设置 一 个 或 多 个 按 
钮 。 如 下 所 示 : 
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import pyautogui 

buttons = ['OK', 'Cancel'] 

msg = pyautogui .confirm(text=' 这 是 confirm! '，title='Confirm'， 
buttons=buttons) 

# 如 果 单 击 OK 按钮 ， 则 输出 Ok， 如 果 单 击 cancel， 则 输出 cancel 

print (msg) 


e@ prompt: 带 有 文本 信息 、 文 本 输入 框 及 “确定 ”和 “取消 ”按钮 的 消息 框 。 参 数 text、 
title 和 default 分 别 设置 文本 信息 、 提 示 框 的 标题 以 及 文本 输入 框 的 默认 值 ， 使 用 方法 
pu 


import pyautogui 

msg = pyautogui .prompt (text=' 这 是 prompt! ', title='Prompt', default='') 

# 若 单 击 OK， 则 输出 文本 输入 框 的 内 容 ， 若 单 击 cance1， 输 出 None 

print (msg) 

@ password: 与 prompt 相 似 ， 只 不 过 文本 输入 框 的 内 容 会 被 参数 mask 所 替换 显示 。 使 用 

方法 如 下 : 

import pyautogui 

msg = pyautogui.password (text=' 这 是 Pw! ',， title='Password', default="'', 
mask="*") 


# 若 单 击 OK， 则 输出 文本 输入 框 的 内 容 ， 若 单 击 cancel， 输 出 None 
print (msg) 


10.6 ”实战 : 编写 “百度 用 户 登录 ”程序 


PyAutoGUI 是 根据 计算 机 的 图 形 界面 坐标 定位 来 实现 自动 化 操作 ， 它 能 操作 计算 机 上 
的 任何 软件 ， 只 要 能 在 计算 机 上 显示 出 来 都 可 以 操控 ， 适 用 范围 广 ， 也 正 因 如 此 ， 它 的 稳 
定性 相当 差 。 在 第 8 章 中 ， 我 们 使 用 Selenium 实现 了 网 页 的 自动 化 操作 ， 而 在 本 章 中 ， 我 
们 沿用 第 8 章 的 例子 ， 使 用 PyAutoGUI 实现 百度 用 户 登 录 功 能 。 
可 顾 一 下 百度 用 户 登 录 过 程 ， 打 开 百 度 网 站 https://www.baidu.com/， 单 击 “ 登 录 ” 链 
接 会 弹出 一 个 用 户 登 录 界 面 ， 然 后 再 单 击 “ 用 户 名 登录 ”， 如 图 10-7 所 示 。 

在 用 户 名 登录 界面 中 ， 百 度 会 根据 不 同 的 用 户 名 去 检测 是 否 需要 设置 验证 码 登 录 ， 这 
是 由 于 不 同 的 用 户 设置 了 不 同 的 安全 机 制 ， 那 么 在 使 用 PyAutoGUI 实现 登录 的 时 候 ， 需 要 
检测 验证 码 是 否 存在 。 从 界面 上 看 到 ， 根 据 关 键 字 “ 换 一 张 ”来 判断 验证 码 ， 如 图 10-8 
所 示 。 
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从 下 让 .人 Fn 诈 x 


< © Bhtps/wwwbaiducom | 


Ex 


图 10-7 百度 登录 界面 图 10-8 用 户 名 登录 界面 


从 图 10-8 上 可 以 看 到 ， 整 个 登录 过 程 需要 输入 用 户 账号 、 密 码 、 验 证 码 和 单 击 登录 按 
钮 。 验 证 码 还 需要 通过 判断 是 否 存在 ， 若 存在 ， 则 提示 输入 验证 码 ， 否 则 直接 单 击 登录 按 
钮 。 此 外 ， 验 证 码 的 内 容 有 可 能 是 中 文 ， 而 PyAutoGUI 不 支持 中 文 输入 。 对 于 这 个 问题 ， 
只 能 将 中 文 发 送 到 计算 机 的 剪贴 板 上 ， 然 后 由 PyAutoGUI 使 用 热 键 hotkey0 函 数 执行 Ctrl + 
V， 将 中 文 粘贴 到 网 页 的 文本 框 里 。 

根据 上 述 分 析 ， 我 们 将 整个 登陆 过 程 一 共 划 分 了 4 个 步骤 ， 每 个 步 又 说 明 如 下 : 


(1) 单 击 计算 机 桌面 的 浏览 器 图 标 ， 打 开 浏 览 器 并 输入 百度 首页 地 址 。 在 打开 百度 之 
前 ， 需 要 确保 网 址 没有 处 于 登录 状态 。 

(2) 在 百度 网 页 中 找到 “登录 ”链接 的 坐标 位 置 ， 然 后 单 击 进入 登录 界面 。 登 录 界 
是 一 个 扫 码 登录 ， 因 此 还 需要 单 击 下 方 的 “用 户 名 登录 ”链接 ， 进 入 用 户 名 登录 界面 。 

(3) 在 用 户 名 登录 界面 中 ， 首 先 单 击 百度 logo， 使 界面 处 于 活动 状态 ， 然 后 操控 键盘 
的 tab 按键 ， 依 次 激活 用 户 名 文本 框 、 密 码 文本 框 和 验证 码 文本 框 。 每 个 文本 框 激活 后 会 
弹出 一 个 消息 提示 框 ， 让 用 户 分 别 输入 账号 、 密 码 和 验证 码 信息 。 

(4) PyAutoGUI 输入 登录 信息 之 后 ， 会 单 击 两 次 “登录 ”按钮 。 如 果 登 录 信 息 正 确 ， 
那么 第 二 次 单 击 “ 登 录 ” 按 钮 会 抛 出 异常 ， 程 序 会 输出 “登录 成 功 ” 并 终止 循环 ， 如 果 登 
录 信 息 错误 ， 第 二 次 单 击 “ 登 录 ” 按 钮 等 于 让 登录 界面 重新 激活 ， 并 再 次 执行 输入 账号 、 
密码 和 验证 码 。 


在 上 述 的 实现 步骤 中 ， 需 要 考虑 一 些 技术 难点 以 及 功能 架构 的 设计 。 比 如 验证 码 的 输 
入 、 用 户 登录 成 功 与 失败 的 操作 处 理 以 及 一 些 操作 细节 处 理 。 根 据 这 些 问 题 ， 项 目 实现 代码 
如 下 所 示 : 
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import pyautogui 

import time 

import win32clipboard 

import win32con 

# 向 剪贴 板 发 送 数 据 ， 用 于 ctrl + C 

def settext (text): 
win32clipboard.OpenClipboard () 
win32clipboard.EmptyClipboard() 


win32clipboard.SetcClipboardData (win32con.CF UNICODETEXT, text) 


win32clipboard.CloseClipboard() 


# 设置 单 击 功能 


def mouseClick (image, xoffset=0, interval=1, duration=1): 


x, Yy = pyautogui.locateCenteronscreen (image) 
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pyautogui.click (x+xoffset, y, interval=interval, duration=duration) 


time.sleep (1) 


# 打开 浏览 器 ， 进 入 用 户 账号 密码 登录 界面 

mouseClick('chrome.png') 

mouseClick('url.png', 100) 

pyautogui .typewrite('https://www.baidu.com/', interval=0.1 
pyautogui.hotkey ('enter') 

time.sleep (2) 

mouseClick('login.png') 

mouseClick('userLogin.png') 


# 输入 账号 、 密 码 、 验 证 码 
while 1: 
Ey 
mouseClick('logo.png') 
# 账号 
pyautogui .hotkey ('tab') 


username = pyautogui .prompt (text=' 输 入 百度 账号 '，title=' 账 号 ' ) 


pyautogui .typewrite (username, interval=0.2) 
# 密码 

pyautogui .hotkey ('tab') 
pyautogui.hotkey('ctrl', 'a') 


password = pyautogui .password (text=' 输 入 百度 密码 '，title=' 密 码 '， 


mask="'*"') 
pyautogui .typewrite (password, interval=0.2) 


验证 码 
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1 
x, y = pyautogui.locateCenterOonscreen('code.png') 
pyautogui .hotkey ('tab') 
code = pyautogui .prompt (text=' 输 入 验证 码 '，title=' 验 证 码 ') 
settext (code) 
pyautogui.hotkey('ctrl', 'v') 

except: pass 

# 单 击 登 录 按钮 

mouseClick('su.png') 

mouseClick('su.png') 

except: 
print (' 登录 成 功 ') 


break 


上 述 代码 实现 了 整个 用 户 的 登录 过 程 ， 整 段 代码 分 为 4 部 分 ， 每 个 部 分 负责 实现 不 同 
的 功能 ， 具 体 说 明 如 下 : 


(1) settext0 函 数 使 用 win32con 和 win32clipboard 模块 实现 ， 可 将 数值 传 入 计算 机 的 
剪贴 板 里 ， 相 当 于 Ctrl+C 的 功能 ， 该 函数 用 于 中 文 验证 码 的 输入 

(2) mouseClickO 函 数 根 据 传 入 的 图 片 识 别 计算 机 屏幕 - 上 的 图 形 所 在 位 置 ， 然后 对 该 
图 形 进行 单 击 操作 。 其 中 函数 参数 xoffset 是 X 坐标 的 偏 移 位 置 ， 因 为 网 址 输入 框 是 一 个 空 
9 的 文本 框 ，PyAutoGUTI 无 法 准确 定位 ， 因 此 将 地 址 栏 前 面 的 刷新 按钮 作为 定位 目标 ， 然 
后 根据 定位 坐标 执行 偏 移 单 击 ， 这 样 就 能 激活 网 址 输入 框 。 

(3) 打开 浏览 器 并 进入 用 户 名 登录 界面 ， 这 是 项 目 刚 开始 执行 的 程序 。 程 序 首先 单 击 
Windows 任务 栏 的 浏览 器 图 标 ， 打 开 浏览 器 ， 如 图 10-9 所 示 ; 然后 定位 浏览 器 的 刷新 按 
钮 ， 单 击 按钮 后 面 的 网 址 输入 框 并 输入 百度 首页 进行 访问 ; 在 百度 首页 单 击 “ 登 录 ” 链 
接 ， 网 页 就 会 出 现 扫 码 登录 界面 ， 最 后 单 击 “ 用 户 名 登 
录 ”， 进 入 用 户 名 登录 界面 。 具 体操 作 过 程 如 图 10-8 所 
示 ， 用 户 名 登录 界面 如 图 10-9 所 示 。 图 10-9 单 击 浏览 器 图 标 

(4) 在 用 户 名 登录 界面 里 ， 设 置 了 一 个 while 循环 和 两 个 try…except 异常 机 制 。 在 
while 循 坏 里 ， 首 先 单 击 百度 logo， 目 的 是 激活 用 户 名 登录 界面 。 然 后 通过 快捷 键 tab 分 别 
激活 账号 、 密 码 及 验证 码 文本 输入 框 ， 每 激活 一 次 都 会 弹出 消息 框 ， 消 息 框 用 于 输入 账 
号 、 密 码 和 验证 码 信息 。 验 证 码 部 分 使 用 try…except 处 理 ， 因 为 不 是 所 有 的 账号 都 有 验证 
码 出 现 。 最 后 单 击 两 次 “登录 ”按钮 ， 对 于 这 个 设 定 在 上 述 步骤 说 明 中 已 有 解释 。 


最 后 ， 代 码 中 的 图 片 必须 为 png 格式 ， 读 者 在 运行 上 述 代码 之 前 ， 需 要 重新 对 定位 图 
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片 进行 截取 ， 因 为 每 台 计算 机 的 分 辩 率 都 有 所 差异 ， 定 位 图 片 很 难 通用 每 台 计 算 机 。 定 位 
片 信 息 如 图 10-10 所 示 。 


四 二 强 Bai 放 ee 


chromepng codepng loginpng logopng 


Re 


userlogin.png 


图 10-10 定位 图 片 
10.7 ”本章 小 结 


PyAutoGUI 是 一 个 纯 Python 开发 的 跨 平 台 GUI 自动 化 工具 ， 它 是 通过 程序 来 控制 计算 
机 的 键盘 和 鼠标 的 操作 ， 从 而 实现 自动 化 功能 。 所 谓 的 GUI 是 指 图 形 用 户 界面 ， 这 是 通过 
图 形 方式 来 显示 计算 机 的 界面 ， 早 期 的 计算 机 是 以 命令 行 界面 来 操作 ， 其 中 Linux 服务 器 
版 本 仍 在 使 用 ， 而 日 常 工作 中 使 用 的 Windows、Mac 和 Linux 桌面 发 行 版 都 是 以 GUI 来 

PyAutoGUI 主要 有 三 大 功能 :鼠标 操控 、 键 盘 操控 和 截图 识别 ， 三 者 可 以 相互 协调 使 
用 。 截 图 识别 可 以 为 计算 机 提供 简单 的 视觉 功能 ， 让 PyAutoGUI 在 计算 机 上 找到 某 个 按钮 
或 某 个 图 标的 坐标 位 置 ， 然 后 操作 鼠标 或 键盘 来 实现 自动 化 控制 。PyAutoGUTI 的 函数 汇总 如 
表 10-1 所 示 。 


表 10-1 PyAutoGUI 的 函数 汇总 


函数 说 明 

screenshot() 对 当前 屏幕 截屏 

locateOnScreen() 找 出 图 标 具 体 的 坐标 位 置 
locateCenterOnScreen() 找 出 图 标的 中 心 坐标 位 置 

center() 根据 图 标 具体 的 坐标 位 置 找 出 中 心 坐标 
locateAllOnScreen() 找 出 所 有 符合 条 件 的 图 标 位 置 
pixelMatchesColor0 某 个 像素 点 与 颜色 匹配 

size() 获取 屏幕 分 辨 率 

position() 获取 当前 鼠标 的 光标 位 置 
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( 续 表 ) 


函数 说 明 

moveTo0 鼠标 移动 到 某 个 坐标 
moveRel() 当前 鼠标 所 在 位 置 进行 偏 移 
clickO 鼠标 单 击 功能 
mouseDown() 鼠标 按键 长 按 
mouseUpO 鼠标 按键 释放 
scroll0 鼠标 滑 珠 滚动 
typewrite() 键盘 的 文本 输入 
keyDown() 键盘 某 个 按键 长 按 
keyUpO 键盘 某 个 按键 释放 
hotkeyO 键盘 的 热 键 组 合 使 用 


和 单个 按钮 的 消息 框 
带 有 文本 信息 和 多 个 按钮 的 消息 框 
带 有 文本 信息 、 文 本 输入 框 和 按钮 的 消息 框 
与 prompt 相似 ， 输 入 的 文本 内 容 会 屏蔽 显示 


alert() 


confirm() 


prompt() 
password() 


软件 自动 化 开发 


本 章 讲述 如 何 使 用 PyWinAuto 实现 软件 自动 化 开发 ， 其 底层 原理 是 Windows API， 因 
此 只 适用 于 Windows 操作 系统 。 它 主要 对 Windows 的 桌面 应 用 实现 自动 化 操作 ， 如 办 公 软 
件 Word 和 正 浏 览 器 等 。 


11.1 PyWinAuto 概述 及 安装 


PyWinAuto 也 是 一 个 用 纯 Python 编写 的 GUI 自动 化 库 ， 用 于 自动 化 操作 C/S 软件 ， 也 就 
是 计算 机 上 一 些 应 用 软件 ， 比 如 计算 机 的 QQ 软件 、Excel 和 Word 等 ， 它 只 适用 于 Windows 
的 GUI。 

PyWinAuto 将 Windows 的 GUI 分 为 Win32 和 uia， 这 是 由 于 Microsoft 平台 开发 的 C/S 
应 用 程序 底层 原理 有 所 不 同 ， 两 者 的 实现 原理 分 别 基 于 Win32 API 和 MS UI， 这 是 
Microsoft 平台 的 应 用 程序 的 底层 接口 。Win32 支持 MFC、VB6、VCL、 简 单 的 WinForms 
控件 和 大 多 数 旧 的 应 用 程序 ，uia 支持 WinForms、WPF 和 Qt5 等 。 

讲 了 这 么 多 ， 相 信 读 者 也 很 难 区 分 一 个 软件 究竟 是 Win32 还 是 uvia， 如 果 单 纯 去 看 或 简 
ne 因此 我 们 需要 借助 辅助 软件 识别 软件 的 类 型 。 开 发 软件 的 自动 化 程 

必须 借助 辅助 软件 才能 完成 ， 这 些 软件 能 帮 有 我 们 捕捉 软件 的 控件 信息 ， 比 如 某 个 按钮 在 
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软件 里 的 命名 ， 这 种 命名 并 不 是 软件 表面 上 看 到 的 “确定 ”或 “登录 ”按钮 ， 而 是 软件 底 
层 中 的 一 些 命名 。 常 用 的 辅助 软件 如 图 11-1 所 示 。 


加 六 时 全 


AccEventexe AccExplorer32.e Inspectexe SPYXXEXE 


缠 且 @ 国 


swapy-ob-0.4.3. UISpyexe ViewWizard.exe WSEditEXE 
exe 


图 11-1 辅助 软件 


从 图 11-1 看 到 ， 这 类 辅助 软件 类 型 有 很 多 ， 尽 管 如 此 ， 它 们 的 使 用 方法 都 是 相似 的 。 
本 书 讲述 如 何 使 用 Inspect.exe 和 UISpy.exe 识别 软件 类 型 。 
下 面 介绍 搭建 PyWinAuto 的 开发 环境 ，PyWinAuto 模块 有 三 个 依赖 模块 : pyWin32、 
comtypes 和 six 模块 ， 这 些 模块 在 安装 PyWinAuto 的 时 候 会 自动 安装 。 我 们 选择 傻瓜 式 安 
装 方法 ， 在 Windows 的 CMD 下 输入 安装 指令 : pip install pywinauto 即 可 完成 安装 。 

PyWinAuto 安装 成 功 后 ， 在 CMD 下 进入 Python 的 交互 模式 ， 进 一 步 验证 PyWinAuto 
是 否 安 装 成 功 ， 具 体 的 验证 方法 如 下 : 

C:\Users\000>python 

python 3-7.0 (v3:7.0:1bE9cc5093, Jun 27 2019,. 04:59%5L) {LMSC m19L4 4 bit 
(RMD64) ] on win32 


Type "help", "copyright", "credits" or "license" for more information. 
>>> import pywinauto 


>>> pywinauto. version _ 
"0.6.5" 


11.2 ”查找 软件 信息 


查找 软件 信息 与 Selenium 的 元 素 查找 非常 相似 ， 只 不 过 两 者 所 使 用 的 查找 工具 有 所 不 
同 。 软 件 信息 主要 有 软件 中 的 功能 控件 ， 如 按钮 、 文 本 框 、 表 格 、 下 拉 框 等 。 查 找 这 些 信 
息 的 目的 是 为 了 获取 控件 在 软件 里 的 命名 ， 例 如 一 个 软件 界面 有 多 个 按钮 ， 若 想 精 准 地 单 
击 其 中 一 个 按钮 ， 那 么 我 们 需要 知道 这 个 按钮 的 命名 才能 让 PyWinAuto 去 识别 和 单 击 。 
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于 软件 的 类 型 分 为 Win32 和 uia， 因 此 需要 分 别 讲 述 Inspect.exe 和 UISpy.exe 的 使 用 
方法 ， 即 前 者 是 查找 uia 软件 的 信息 ， 后 者 是 查找 Win32 软件 的 信息 。 

首先 讲述 Inspect.exe 的 使 用 ， 打 开 Inspect.exe 可 以 看 到 软件 界面 划分 三 大 区 域 : 功能 
区 、 软 件 汇总 区 和 软件 信息 区 ， 如 图 11-2 所 示 。 


吉 Inspect (HWND: 0x00030A24) 


EYE 
i 
UIA PaneControlTypeTd (0xC371) 
{1;0 t-0 r:1920 b:1080} 
true 
false 
由 "ATalk" 窗口 | ee 软件 信息 区 
自 “" 微 信 " 窗口 22416 
由 "PyWinAuto 工 具 " 窗口 [zk 10010] 
由 “ 密 属 襄 ins2” 


A 
由 "program Manager" 下 ert 


10010 
“[pid:15112, hwnd:0x10010 Annotation(parent Limk) 
false 


软件 汇总 区 


图 11-2 ”Inspect 界面 信息 


功能 区 是 Inspect 的 功能 设置 ， 一 般 情况 下 我 们 使 用 默认 设置 即 可 。 如 果 要 查找 uia 软件 
的 信息 ， 在 功能 区 左上 角 的 下 拉 列 表 中 选中 UI Automation 选项 ， 否 则 Inspect 无 法 捕捉 软件 


软件 汇总 区 是 当前 计算 机 全 部 正在 运行 的 软件 列表 ， 单 击 “+” 号 可 以 看 到 该 软件 下 
的 一 些 控 件 信息 。 

软件 信息 区 是 显示 当前 控件 的 详细 信息 ， 当 单 击 左 侧 的 软件 汇总 区 某 个 控件 或 者 鼠标 
单 击 一 下 计算 机 上 某 个 软件 的 程序 窗 体 ， 它 就 会 自动 显示 相关 的 信息 

为 了 更 好 地 理解 Inspect 的 使 用 ， 我 们 运行 qtGUILpy 文 件 ， 该 文件 生成 一 个 由 PyQts 开 
发 的 软件 界面 。 在 运行 文件 之 前 ， 需 要 使 用 pip 安装 PyQt5 模块 (pip install pyqt5) 。 
qtGULpy 文件 运行 后 会 启动 一 个 名 为 Pywinauto 的 软件 ， 软 件 中 含有 一 些 常 用 的 控件 ， 如 
文本 输入 框 、 单 选 按 钮 、 下 拉 框 、 勾 选 框 、 按 钮 和 表格 ， 这 些 控 件 都 可 以 通过 Inspect 捕 
捉 ， 如 图 11-3 所 示 。 

从 图 11-3 可 以 看 到 ，Inspect 获 取 了 整个 软件 的 控件 信息 ， 在 右 侧 的 软件 信息 区 里 ， 一 般 
只 需 关 注 属性 Name、ClassName 和 AutomationId 的 信息 ， 这 些 信 息 用 于 PyWinAuto 连接 并 
操控 软件 。 

接 下 来 讲述 UISpy.exe 的 使 用 ， 打 开 UISpy.exe 看 到 软件 界面 与 Inspect.exe 的 界面 相 
似 ， 也 是 分 为 三 大 区 域 : 功能 区 、 软 件 汇 总 区 和 软件 信息 区 ， 如 图 11-4 所 示 。 
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姓名 


性 别 


所 在 地 


注册 事项 。 口 ] 我 已 阅读 有 关 事项 


关闭 


显 ulspy 
le Ed View Events Navigation Mode Help 


旦 p> 四 | 蚊 吕 | 马 


运行 wxGUIPYy 文件 ， 该 文件 


六 | 人 


pyWinAu 
pywinaut 
"python 二 


" "python 自 


弄 Inspect (HWND: 0x003F13D2) 


图 11-3 qtGUIpy 的 控件 信息 


人 ^ AutomationElement 


General Accessibility 
AccessKey: 
AcceleratorKey: 
IsKeyboardFocusable: “False” 
LabeledBy: “(null)* 
HelpText: - 


State 
IsEnabled: "True” 


HasKeyboardFocus: -False 


Identification 


图 11-4 UISpy 界面 信息 


F 生 成 一 个 与 qtGUIpy 类 似 的 软件 界 
wxPython 库 开 发 的 软件 ，wxPython 是 一 个 Python 包装 wxWidgets (基于 C++ 编写 ) 的 跨 了 


TypeTa (osc3i0) 


7 406 1:912 b:693} 


台 GUI 工具 包 。 在 运行 文件 之 前 ， 需 要 安装 wxPython 模块 ， 该 模块 可 以 使 用 pip 指令 


(pip install wxPython) 。wxGULpy 文件 运行 后 启动 一 个 名 为 Pywinauto 


UISpy 查看 该 软件 信息 ， 如 图 11-5 所 示 。 


根据 图 


11-5 中 的 信息 


PyWinAuto 主要 通过 这 些 属性 来 定位 并 操控 控件 。 综 合 上 述 ， 不 


同 的 辅助 软件 去 识别 ， 
息 ， 通 过 这 些 信 息 实现 PyWinAuto 和 软件 的 连接 与 操控 。 


在 


发 PyWinAuto 自动 化 程序 的 时 候 ， 使 


可 知 ， 我 们 只 需 获 取 控 件 属性 ClassName 和 Name 即 可 ， 


面 ， 但 它 是 上 


HN 达 


安装 


为 软件 ， 然 后 在 


因为 


同 的 软件 类 型 需要 使 


不 


用 辅助 软件 获取 软件 的 信 


自居 食品 " "Pywineuto" 
局 文 # 英名- 
已 -从 等 共 和 


自 
中 
相 


站 
HE 


HE 
Ei 
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j 
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IsControltlement 
IsContentElement: 


| veaaw 


BoundingRectangle: "0458 493, 111, 25)" 


图 11-5 wxGUIpy 的 控件 信息 


值得 注意 的 是 ， 有 时 候 会 出 现 同一 个 辅助 软件 都 可 以 识别 Win32 和 uia 类 型 的 情况 ， 


因为 Win32 和 uia 有 很 多 相同 的 共性 ， 但 是 细心 观察 会 发 现 ， 不 同类 型 的 软件 使 用 同一 个 


辅助 软件 去 识别 ， 辅 助 软件 能 识别 控件 的 信息 会 有 所 不 同 。 比 如 使 用 UISpy.exe 识别 两 个 
一 样 的 软件 ， 但 两 个 软件 分 别 是 Win32 和 uia 类 型 ， 它 可 以 识别 Win32 的 所 有 控件 信息 ， 
但 无 法 识别 uia 的 所 有 控件 信息 。 


11.3 连接 CS 软件 


在 PyWinAuto 连接 软件 之 前 ， 首 先 需要 确定 软件 的 类 型 ， 然 后 使 用 PyWinAuto 的 
Application 类 实例 化 并 设置 软件 类 型 。 具 体 的 实现 方法 如 下 : 


from pywinauto.application import Application 


# 创建 uia 软件 实例 


app = Application (backend='uia') 


# 创建 win32 软件 实例 


app = Application (backend='win32') 


上 述 例子 只 是 创建 一 个 软件 实例 对 象 ， 也 就 是 将 PyWinAuto 的 Application 类 实例 化 并 
设置 软件 类 型 。 实 例 对 象 app 还 没有 将 PyWinAuto 和 目标 软件 实现 连接 。 而 PyWinAuto 连 
接 软件 有 两 种 方式 : 连接 已 在 运行 的 软件 和 启动 软件 并 连接 。 

连接 已 在 运行 的 软件 是 在 app 对 象 中 使 用 connect0 方 法 实现 ， 这 样 PyWinAuto 可 以 直 
接连 接 计算 机 上 正在 运行 的 软件 应 用 程序 。connect0 方 法 支持 4 种 连接 方式 ， 代 码 如 下 : 
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# 使 用 进程 ID (PID) 进行 连接 

# process 是 软件 的 进程 ID 

SW = app.connect (process=24292) 
## 使 用 窗口 句柄 连接 

sw = app.connect (handle=0x50074) 


# 使 用 软件 路 径 连 接 
path = "C:\Program Files (x86)\Tencent\WeChat\WeChat .exe" 


sw = app.connect (path=path) 
# 使 用 标题 、 类 型 等 匹配 ， 可 支持 模糊 匹配 


sw = app.connect (title re=" 微 信 *' 并 class name="'WeChatMainWndForPC' ) 


上 述 4 种 连接 方式 中 ， 使 用 软件 路 径 的 连接 方式 是 指 软件 的 安装 路 径 ， 可 以 在 程序 图 
标 上 单 击 右键 ， 查 看 属性 ， 找 到 目标 的 路 径 信 [六 REE 
息 ， 如 图 11-6 所 示 ， 而 其 余 三 种 连接 方式 均 可 “| jm。 wes 村人 安 。 这 8 信息 以前 的 版 本 
在 辅助 软件 里 找到 相关 信息 ， 如 图 11-7 所 示 。 

4 种 连接 方式 中 ， 第 一 和 二 种 方式 的 通用 性 
不 强 ， 因 为 软件 每 次 启动 运行 的 时 候 ， 进 程 数 | Bim sees 
和 句柄 信息 都 可 能 不 一 样 ， 第 三 种 方式 最 为 直 | Bs wechat 
接 简 单 ， 而 且 软 件 的 安装 路 径 也 相对 固定 ; 第 
四 种 方式 的 灵活 性 最 强 ， 因 为 参数 可 以 支持 模 
糊 匹 配 ， 如 参数 title re 和 class_name re。 
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图 11-7 软件 连接 信息 
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启动 软件 并 连接 是 通过 PyWinAuto 启动 一 个 软件 程序 并 对 其 连接 ， 这 个 过 程 由 start0 
方法 实现 。 使 用 start() 方 法 需要 将 软件 应 用 的 路 径 信息 传 入 ，PyWinAuto 在 执行 的 时 候 ， 会 
根据 路 径 去 启动 这 个 软件 应 用 并 连接 ， 使 用 方法 如 下 : 

# 启动 并 连接 微 信 

path = "C:\Program Files (x86)\Tencent\WeChat\WeChat .exe" 

sw = app.start (path) 


连接 了 软件 之 后 ， 下 一 步 是 对 软件 窗口 进行 定位 。 窗 口 定位 由 window() 方 法 实现 ， 该 
方法 在 sw 对 象 里 使 用 ， 并 且 生 成 窗口 对 象 dlg spec， 最 后 可 以 使 用 print_control identifiers() 
方法 将 当前 窗口 里 面 的 控件 信息 全 部 输出 ， 具 体 的 使 用 方法 如 下 : 

# 获取 软件 的 窗口 对 象 dlg spec 


dlg spec = sw.window(title re=' 微 信 *'，class_name='WeChatMainWndForPC') 
# 输出 窗口 里 的 控件 信息 


dlg spec.print control identifiers() 
综合 上 述 ， 整 个 软件 连接 分 为 4 个 步 又 : 


(1) 创建 Application 实例 app 对 象 并 设置 软件 类 型 。 

(2) 将 app 对 象 与 目标 软件 进行 连接 ， 生 成 sw 对 象 。 连 接 软 件 有 两 种 方法 : connectO 
和 start()。 

(3) 在 sw 对 象 中 使 用 window0 方 法 进行 软件 窗口 定位 ， 生 成 dlg_spec 对 象 。 

(4) 在 dlg_spec 对象 使 用 print_control identifiers() 将 当前 窗口 的 控件 信息 全 部 输出 。 
完整 代码 如 下 : 


from pywinauto.application import Application 

# 创建 Application 实例 app 对 象 并 设置 软件 类 型 

app = Application (backend='uia') 

# 将 app 对 象 与 目标 软件 进行 绑 定 ， 生 成 sw 对 象 

path = "C:\Program Files (x86)\Tencent\WeChat\WeChat .exe" 
sw = app.connect (path=path) 

# 获取 软件 的 窗口 对 象 dlg spec 


dlg spec = sw.window (title re=' 微 信 *'，class_name='WeCchatMainWndForPC'") 
# 输出 窗口 里 的 控件 信息 


dlg_ spec.print control identifiers () 


于 上 述 代 码 是 使 用 connect0 方 法 连接 微 信 和 软件， 因此 在 代码 运行 之 前 必须 在 
Windows 的 任务 栏 保 证 微 信 处 于 正在 运行 状态 ， 代 码 输出 的 结果 如 图 11-8 所 示 。 
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Control Tdentifiers: 


Dialog -“ 微 信 " (L1217, T304, R2067, B881) 
[ Dialog ,，“" 微 信 Dialog" ，' 微 信 "] 
child_window(title=" 获 信 "，control_type= "Window”) 
1 
| Pane = "” (L1197, T284, R2087, B901) 
| [’, "Pane’, ’Pane0’, 'Panel’, '0', "1"] 
1 
| Pane ~- ’ChatContactMenu’  (L-10000, T-10000, R-9999, B-9999) 
TchatContactMenuPane” , ' ChatContactMenu' ，"Pane2'] 
child_window(title= ChatContactMenu “，control_type= Pane“) 


(L-10019，T-10019，R-9980，B-9980) 


| 
1 
1 
| 
1 


["2'，"Pane3'] 


Process finished with exit code 0 


图 11-8 PyWinAuto 连接 微 信和 电脑 版 
代码 中 的 print_control identifiers() 方 法 是 将 当前 窗口 的 控件 信息 输出 ， 然 后 通过 这 些 


信息 去 控制 软件 中 的 控件 。 图 上 的 信息 说 明 如 下 : 


(1) child_window 表示 这 个 软件 里 的 子 窗口 ， 子 窗口 可 以 是 单个 控件 ， 也 可 以 是 多 个 


控件 的 组 合 。 


(2) 控件 信息 分 为 控件 名 、 控 件 的 坐标 位 置 及 PyWinAuto 对 控件 的 命名 ， 如 Pane - " 


代表 控件 名 。 


(3) (L1197, T284, R2087, B901) 代 表 控 件 的 坐标 位 置 。 
(4) [", 'Pane', ' Pane0', ' Panel1', '0', '11] 代 表 PyWinAuto 对 控件 的 命名 ，PyWinAuto 操作 


某 个 控件 需要 通过 这 些 命名 定位 。 


如 果 使 用 child window0 定位 软件 的 子 窗口 ， 在 子 窗口 对 象 中 使 用 


print_control identifiers() 方 法 只 会 输出 这 个 子 窗口 里 面 的 控件 信息 ， 具 体 的 代码 如 下 : 


from pywinauto.application import Application 

# 创建 Application 实例 app 对 象 并 设置 软件 类 型 

app = Application (backend='uia') 

# 将 app 对 象 与 目标 软件 进行 绑 定 ， 生 成 sw 对 象 

path = "C:\Program Files (x86)\Tencent\WeChat\WeChat .exen" 

sw = app.connect (path=path) 

# 获取 软件 的 窗口 对 象 dlg_spec 

dlg spec = sw.window (title re=' 微 信 *'， class name='WeChatMainWndForPC') 
# 定位 子 窗口 

cw = dlg spec.child window (title="ChatContactMenu"， control type="Pane") 


cw.print control identifiers() 
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运行 结果 如 图 11-9 所 示 。 


Control Identifiers: 


Pane — 'ChatContactMenu’ (L-10000，T-10000，R-9999，B-9999) 
[’ ChatContactMenuPane’, 'Pane’, "ChatContactMenu ， "Pane0 ，“"Panel ] 


child_window(title="ChatContactMenu”, control_type=“Pane”) 


Pane - (L-10019，T-10019，R-9980，B-9980) 


["，" Pane2' ] 


图 11-9 子 窗口 的 控件 信息 


从 上 述 例子 可 以 看 到 ，PyWinAnuto 会 将 软件 看 成 一 个 Window， 而 软件 里 面 可 以 包含 
多 个 子 窗 child_， window， 这 些 子 窗口 大 多 数 都 是 一 些 软件 控件 ， 这 些 控件 可 以 再 网 套 一 
些 控件 在 里 面 ， 这 样 就 变 成 了 子 窗 

在 止 一 节 中 ， 我 们 讲 过 同一 个 辅助 软件 可 以 识别 | Win32 和 uia 的 软件 ， 但 识别 出 来 的 
控件 信息 是 存在 差异 的 。 如 果 要 更 加 准确 地 判断 一 个 软件 的 类 型 ， 可 以 分 别 设置 
PyWinAuto 的 软件 类 型 参数 backend， 然 后 使 用 print_control identifiers() 方 法 分 别 输 出 软件 
的 控件 信息 ， 哪 个 类 型 输出 的 信息 较 多 ， 则 可 以 判断 该 软件 就 属于 这 个 类 型 。 


11.4 基于 Uia 软件 操控 


我 们 知道 ，PyWinAuto 将 软件 分 为 uia 和 Win32 类 型 ，PyWinAuto 对 于 不 同 的 软件 类 
型 有 着 不 一 样 的 操控 方式 。 本 节 主 要 讲述 
uia 软件 的 操控 方法 ， 以 qtGULpy 文件 的 软 
件 为 例 ， 软 件 中 列 出 了 一 些 常 用 的 控件 : 文 
本 框 、 单 选 框 、 下 拉 框 、 色 选 框 、 按 钮 以 及 表 
格 ， 如 图 11-10 所 示 。 

在 计算 机 上 运行 qtGULpy 文件 ， 我 们 将 
qtGULpy 文件 生成 的 软件 称 为 qtGUI 软件 。 
通过 Inspect 辅助 工具 捕捉 qtGUI 软件 的 信 
息 ， 见 图 11-3; 然后 使 用 PyWinAuto 连接 
qtGUI 软件 ， 连 接 代 码 如 下 : 


注册 事项 。 口 ] 我 已 癌 读 有 关 事项 


关闭 


图 11-10 软件 界面 


from pywinauto.application import Application 


import time 
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对 软件 的 控件 进行 自动 化 操控 。 首 先 对 qtGUI 软件 的 文本 框 进 


信 


下 
UD 


# 实例 化 Application 并 连接 qtGUI 软件 

app = Application (backend='uia') 

dlg = app.connect (title re='Pywinauto', class name="'QMainWindow') 

# 绑 定 qtGUI 软件 窗口 

dlg spec = dlg.window (title re='Pywinauto', class name="'QMainWindow') 
# 输出 qtGUI 软件 的 窗口 信息 

dlg spec.print control identifiers () 

# 设置 焦点 ， 使 其 处 于 活动 状态 

dlg spec.set focus() 


上 述 代码 连接 了 qtGUI 软件 并 输出 软件 里 的 控件 信息 ， 通 过 这 
行文 


文 些 输出 信息 ， 可 以 分 别 
本 写 入 和 读 取 ， 在 输出 


息 中 找到 文本 框 的 信息 ， 如 图 11-11 所 示 。 


图 11-11 文本 框 控件 信息 
图 11-11 中 是 qtGUI 软件 的 文本 框 信息 ，PyWinAuto 对 文本 框 有 多 个 命名 ， 我 们 只 需 


其 中 一 个 命名 即 可 实现 自动 化 操控 。 一 般 来 说 ， 命 名 的 选取 都 是 以 特征 明显 优先 ， 如 图 
的 Edit0 和 Editl 最 具 代表 性 。 以 Edit0 为 例 ， 文 本 框 的 写 入 和 读 取 方法 如 下 : 


# 文本 框 输入 数据 

dlg_spec.Edit0.set edit text('Hello Python') 
dlg_spec['Edit0'] .type keys('Hi Python') 

# 获取 文本 框 数据 内 容 

Print (' 文 本 框 数 据 : '，dlg_spec['Edit0'] .texts()) 

Print (' 文 本 框 数 据 : '，dlg spec['Edit0'] .text block()) 
Print (' 文 本 框 数 据 : '， dlg spec['Edit0'] .window text ()) 
time.sleep (1) 


从 上 述 代码 中 可 以 看 到 ， 文 本 框 的 写 入 和 读 取 是 基于 dlg spec 对 象 ， 它 是 定位 了 


qtGUI 软 件 的 主 窗口 。 在 dlg_spec 对 象 中 定位 Edit0 文 本 框 有 两 种 方式 ， 使 用 “.” 定 位 或 者 


使 
在 


英 


用 “[]” 定 位 ， 其 中 后 者 比 前 者 更 具 优 势 ， 因 为 有 时 候 控件 命名 会 出 现 一 些 特殊 符号 ， 
这 种 情况 ，“ 口 ”定位 也 能 精准 实现 定位 。 

对 于 文本 框 的 写 入 分 别 使 用 了 set_edit text0 和 type_keys0 方 法 实现 ， 两 者 都 能 实现 中 
文 输入 。 前 者 在 输入 内 容 之 前 会 清空 文本 框 的 内 容 再 输入 ; 后 者 不 管 文本 框 是 否 已 有 内 


容 都 会 直接 输入 。 而 读 取 文本 框 内 容 可 以 使 用 window_textO、texts() 或 text block(O 实 现 。 
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再 看 qtGUI 软件 的 单 选 框 ， 软 件 中 设 有 两 个 单 选 框 ， 分 别 代 表 男 和 女 ， 具 体 的 控件 信 


息 如 图 11-12 所 示 ， 根 据 图 中 的 信息 ，PyWinAuto 实现 单 选 框 的 单 击 和 读 取 方 法 如 下 : 


# 依次 单 击 单 选 框 

dlg spec.RadioButton0.select () 
dlg_spec.RadioButton2.click input() 

# 读 取 单 选 杠 

print (' 单 选 框 数据 : '，dlg_spec.RadioButton0.texts()) 

Print (' 单 选 框 数据 : '，dlg_spec.RadioButton0.window text ()) 
time.sleep (1) 


| Radioputten -' 男 ” (L1378, T562, R1412, B578) 
| [CE RadioButton’ ,' 男 " ,RadioButton’ “RadicButton0" ,* RadioButtonl’ ] 

| child window(title=" 男 ",，auto_id="Dialog radioButton”, control_type="RadioButton”) 

1 

| checkBox -“ 我 已 阅读 有 关 事项 (L1378, T6052, R1495, B008) 

| [我 已 阅读 有 关 事项 CheckBox' ，' 我 已 阅读 有 关 事项 '，" CheckBox ] 

| child_window(title=” 我 已 阅读 有 关 事项 ，auto_id=“Dialog checkBox"，control_typer“checkBox") 
1 

| Edit - “姓名 ” (L1308, T512, R1362, B524) 

| ['8’, "Edit2’] 

| child_window(title=" 姓 名 ”，auto_id=“Dialog 1abel”, control_type=“Edit”) 

| 

| RadioButton -, 女 ， 。 (L1448，T562，R1482，B578) 


儿女 "RadioButton2`，" 女 RadioEutton ] 


| child window(title= ", auto_id® Dialog radioButton_2"，control_typen“RadioButton“) 


图 11-12 单 选 框 控件 信息 


单 选 框 的 单 击 可 以 使 用 select0 或 click_input0 方 法 实现 ， 前 者 无 需 移 动 鼠 标 就 可 以 实现 


window_text() 是 以 字符 串 的 形式 返回 读 取 结 果 。 
下 拉 框 的 选 值 和 读 取 也 是 使 用 set_edit text0 和 texts0 方 法 实现 。 使 用 


单 击 勾 选 ， 而 后 者 是 将 鼠标 光标 移动 到 单 选 框 的 位 置 才 执行 单 击 操作 。 单 选 框 的 内 容 读 取 
使 用 texts0 方 法 ， 读 取 结 果 以 列表 的 形式 表示 ， 如 代码 中 读 取 结果 为 : [' 男 


]， 而 


set_edit_text() 必 


须 保证 下 拉 框 是 支持 文本 编辑 ， 也 就 是 在 下 拉 框 中 可 输入 文本 内 容 ，texts0 方 法 是 读 取 下 


拉 框 里 全 部 的 选项 值 ， 每 个 选项 值 以 一 个 列表 表示 。 实 现代 码 如 下 : 


# 设置 下 拉 框 的 可 选 值 

dlg_spec.ComboBox.Edit.set edit text(' 浙 江 省 ') 

# 读 取 下 拉 框 当前 的 数据 

print (' 下 拉 框 数据 : ，'， dlg_ spec.ListBox.texts()) 
time.sleep (1) 

# 输出: 下 拉 框 数据 : [[' 广 东 省 '] ，[' 浙 江 省 "] ，[' 湖 南 省 "]] 


如 果 下 拉 框 不 支持 文本 编辑 ， 使 用 set_edit_text0 就 会 提示 异常 信息 。 正 常情 况 下 ， 人 
为 操作 无 法 编辑 的 下 拉 框 时 ， 需 要 对 下 拉 框 进行 两 次 单 击 ， 第 一 次 单 击 是 为 了 显示 下 拉 列 
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表 ， 第 二 次 单 击 是 在 下 拉 列 表 中 选择 列表 值 ， 那 么 ，PyWinAuto 可 以 模拟 人 为 的 操作 过 
程 ， 从 而 实现 自动 化 ， 具 体 代码 如 下 : 

# 在 qtGUI .py 设置 self .comboBox.setEditable (False) 即 可 实现 无 法 编辑 

# 单 击 下 拉 框 ， 打 开 下 拉 列 表 

dlg_spec.ComboBox.click input () 

# 单 击 下 拉 列 表 某 个 值 

dlg_spec[' 浙 江 省 '] .click _ input () 

qtGUI 的 色 选 框 和 按钮 的 单 击 和 读 取 都 是 可 以 使 用 click inputO 、clickO0 和 texts0、 
WwWindow text() 方 法 实现 。 单 击 方法 click_ input0 和 clickO 在 使 用 上 存在 区 别 ， 对 于 uia 软 件 来 
说 ，click_input0 方 法 可 以 适用 于 任何 控件 的 单 击 ， 而 click0 方 法 只 使 用 部 分 控件 。 比 如 单 
击 文本 框 ， 前 者 可 以 对 文本 框 进行 单 击 操作 ， 而 后 者 则 会 提示 异常 。 勾 选 框 和 按钮 的 操作 
方法 如 下 所 示 : 

# 读 取 并 单 击 checkBox 勾 选 框 

dlg_spec.CheckBox.click input() 


dlg_spec.CheckBox.click() 

print(' 勾 选 框 数 据 : ，'， dlg spec.CheckBox.texts()) 

print (' 勾 选 框 数 据 : ，'， dlg_spec.CheckBox.window text ()) 
time.sleep (1) 

# 读 取 并 单 击 关闭 按钮 

print (' 按 钮 数据 : '，dlg_spec.Button4.texts()) 

print (' 按 钮 数据 : '，d1lg_spec.Button4.window text ()) 
dlg_spec.Button4.click input() 
dlg_spec.Button4.click() 


最 后 ， 使 用 PyWinAuto 读 取 和 修改 数据 表 里 面 的 数据 。 首 先 分 析 数 据 表 的 数据 结构 ， 
数据 表 是 由 Table 控件 生成 的 ， 该 控件 下 有 Header 和 DataItem 元 素 : Header 元 素 代表 数据 
表 的 标题 ， DataItem 元 素 代表 数据 表 的 数据 内 容 。 如 图 11-3 所 示 。 

从 DataItem 的 命名 分 析 可 知 ， 每 个 DataItem 是 以 DataItemX 按 序 命名 ， 如 “ 张 三 ” 的 
Dataltem 命名 为 DataItem1，“20” 的 DataItem 命名 为 DataItem2。 根 据 这 个 规律 ， 可 以 编 
写 一 个 数据 读 取 的 功能 ， 具 体 代码 如 下 : 

# 读 取 数据 表 的 所 有 数据 

print (' 数 据 表 的 所 有 数据 : '，dlg spec.Table.children texts()) 

# 输出 。[''， "11，'21，11'，' 张 三 '，'20'，'2'，' 李 四 "，'25'] 

index = 1 


result = [] 
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while 1: 
EP 
if dlg spec['DataItem' + str(index)] .texts() in result: 
break 


result .append(dlg spec['DataItem' + str(index)] .texts()) 
index += 1 
except: break 
print (' 数 据 表 的 表格 数据 '，result) 
A ON 2 


Table - 和“ (L1743, T461, R1954, B682) 
[14 ，"Table'] 
child_window(auto_id="Dialog. tableWidget”, control_type="Table”) 


Pane - '" (LO, T0, RO, BO) 
| ['15’, 'Pane’] 


Header -= "1° (L1759, T462, R1859, B487) 

[16’, "Header’, "lHeader’, "Header0', 'Headerl’, 'lHeader0’, 'lHeader1’] 
child_window(title="1”, control_type="Header”) 
Header - "2 (L1859，T462，R1959，B487) 

[ 2Header’, '22', "Header2' ，" 2Header0 ， "2Headerl ] 
child_window(title=“2"，control_type="Header“) 


Header - "1 (L1744, T487, R1759, B517) 
[17 ， "Header3', ' 1Header2' ] 
child_window(title="1’, control_type="Header”) 


Dataltem -“ (L1759, T487, R1858, B516) 
[DataItem' ，" 张 =Dataltem"，' 张 三 "，'DataIltem0'，'Datalteml’] 
child_window(title=" 张 三 "，control_type="Dataltem”) 


Dataltem — "20" (L1859, T487, R1958, B516) 
['Dataltem2', “20Dataltem' , '202"] 


child_window(title="20”, control_type=“Dataltem’) 


图 11-13 数据 表 的 结构 信息 


上 述 代码 中 ， 首 先 读 取 数 据 表 的 所 有 数据 ， 这 是 由 children_texts() 方法 实现 ， 如 果 
使 用 texts0 方 法 读 取 数 据 ， 读 取 结 果 是 一 个 空 的 列表 ， 说 明 Table 控件 不 支持 texts0 方 法 

若 想 修改 表格 里 面 某 个 数据 ， 实 现 步 又 模拟 人 为 修改 的 过 程 。 首 先 单 击 数 据 表 里 面 的 
某 个 表格 ,使 其 处 于 激活 状态 ， 然 后 再 输入 相应 的 内 容 即 可 实现 ， 代 码 如 下 所 示 : 

# 修改 数据 表 表格 数据 

dlg spec['DataItem'] .click input() 


dlg spec['DataItem'] .type keys(' 小 黄 ') 
time.sleep (1) 
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此 外 ，PyWinAuto 还 能 操控 qtGUI 软件 的 最 大 化 、 最 小 化 和 关闭 按钮 ， 具 体操 作 方 法 
如 下 : 

# 最 大 化 、 最 小 化 和 关闭 按钮 的 操作 

dlg_ spec.TitleBar. 最 大 化 .click() 


dlg spec.TitleBar. 最 小 化 .click () 
dlg_spec.TitleBar. 关 闭 .click () 


综合 上 述 ， 整 个 qtGUI 软件 的 自动 化 操控 过 程 如 下 : 


(1) 将 PyWinAuto 与 qtGUI 软件 实现 连接 ， 生 成 dlg 对 象 ， 再 通过 dlg 对 象 对 软件 的 
主 窗口 进行 绑 定 与 定位 ， 生 成 dlg_spec 对 象 。 

(2) 通过 dlg_spec 对 象 再 对 目标 控件 进行 定位 ， 定 位 方法 支持 “.” 定 位 或 者 “[]” 
定位 。 

(3) 目标 控件 定位 后 ， 使 用 操控 方法 实现 自动 化 ， 主 要 的 操控 方法 有 : text_block()、 
texts() 、 window_text() 、 select() 、click() 、click input() 、 set_edit text() 、type_keys() 和 
children_texts()。 各 种 操控 方法 的 使 用 范围 以 及 适用 对 象 都 是 各 不 相同 。 


11.5 ”基于 Win32 软件 操控 


本 节 讲 述 Win32 的 软件 自动 化 开发 ， 以 wxGULpy 文件 的 软件 为 例 ， 我 们 将 软件 称 为 
wxGUI 软件 ， 它 列 出 了 一 些 常 用 的 控件 : 文本 框 、 单 选 框 、 下 拉 框 、 勾 选 框 和 按钮 ， 如 图 
11-14 所 示 。 

wxGUI 软件 运行 之 后 ， 接 着 启动 并 运行 UISpy 软件 ， 通 过 UISpy 来 捕捉 wxGUI 软件 
的 信息 ， 如 图 11-15 所 示 。 然 后 通过 这 些 信息 将 PyWinAuto 与 wxGUI 进行 连接 ， 连 接 代码 
如 下 : 


from pywinauto.application import Application 


import time 

# 实例 化 Application 并 连接 wxGUI 软件 

app = Application (backend='win32') 

dlg = app.connect (title re='Pywinauto*', class name re='wxWindowNR*') 
# 连接 软件 的 主 窗口 

dlg spec = dlg.window (title re='Pywinauto', class name='wxWindowNR') 
## 输出 软件 窗口 的 控件 信息 

dlg spec.print control identifiers () 


# 设置 焦点 ， 使 其 处 于 活动 状态 
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dlg spec.set focus() 


ion Mode Help 


“ControlType Win 


Culture: ul 
Automationld: ee 


LocalizedControlType: 窗口 " 


图 11-14 wxGUI 软件 界面 图 11-15 wxGUI 软件 信息 


运行 上 述 代 码 ， 程 序 就 会 将 wxGUI 软 件 的 控件 信息 全 部 输出 ， 通 过 这 些 信息 ， 我 们 可 
以 对 软件 里 面 的 控件 进行 定位 和 操控 。 首 先 讲述 文本 框 的 写 入 和 数据 读 取 ， 在 输出 信息 中 
找到 文本 框 的 信息 ， 如 图 11-16 所 示 。 


wxWindowNR — 'Pywinauto" (L362, T476, R646, B775) 
【wxWindowNR ，"PywinautowxWindowNR ，"Pywinauto ] 
child_window(title=“Pywinauto“，class_name= “wxWindowNR ) 


| 
| Static - "姓名 (L375，T512，R399，B530) 


| [姓名 Static'，'" Static'，" 姓名 '，" Static0" ，" Staticl' ] 
| child_window(titlen 姓名"，class_namer Static") 


|| child_window(class_name="Edit”) 


图 11-16 文本 框 控 件 信息 


将 图 11-16 中 的 信息 与 uia 软件 的 文本 框 信息 (图 11-11) 对 比 发 现 ， 两 者 的 控件 信息 的 
展示 方式 是 一 致 的 。 我 们 选取 “姓名 Edit” 作 为 文本 框 的 定位 元 素 ， 文 本 框 的 写 入 和 读 取 方 
法 如 下 : 

# 文本 框 输入 数据 

dlg_spec[' 姓 名 Edit'] .type keys(' 张 三 ') 

dlg_spec. 姓 名 Edit.set edit text(' 小 黄 ') 


# 获取 文本 框 数据 
print (" 文 本 框 数据 : '，dlg_spec.Edit.window text ()) 
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法 者 


print (' 文 本 框 数 据 : '，dlg spec.Edit.text block()) 

print (' 文 本 框 数 据 : "， dlg spec.Edit.texts()) 

从 上 述 代 码 可 以 看 到 ， 不 管 是 uia 软件 还 是 Win32 软件 ， 两 者 的 文本 框 写 入 和 读 取 方 
g 是 相同 的 。 接 着 分 析 wxGUI 的 单 选 框 ， 同 样 发 现 Win32 的 单 选 框 与 uia 的 单 选 杠 在 实 


动 化 时 的 操作 也 是 相同 的 ， 具 体 的 代码 如 下 : 


# 依次 单 击 单 选 框 

dlg spec. 女 RadioButton.click() 

dlg spec. 男 RadioButton.click input() 

# 读 取 单 选 框 

print (' 单 选 框 数据 : '，d1lg spec. 女 RadioButton.texts()) 

Print (' 单 选 框 数据 : '，dlg_spec. 男 RadioButton.window text ()) 
time.sleep (1) 


对 于 Win32 的 下 拉 框 来 说 ， 它 的 自动 化 操控 方法 与 uia 的 有 所 不 同 ， 因 为 两 者 实现 下 


拉 框 功能 的 底层 接口 方法 不 同 而 导致 的 ， 由 于 底层 实现 的 机 制 不 同 ， 因 此 实现 自动 化 的 代 
码 也 会 随 之 不 同 。 从 wxGUI 看 到 ， 有 两 个 不 同 的 下 拉 框 ， 第 一 个 不 支持 文本 编辑 ， 第 二 个 
支持 文本 编辑 。 不 管 下 拉 框 是 否 支 持 文本 编辑 ， 我 们 都 可 以 使 用 select0 方 法 来 选取 下 拉 列 
表 的 值 。 两 个 不 同 的 下 拉 框 自动 化 代码 如 下 : 


# 选择 下 拉 框 ComboBox 的 数据 (所 在 省 份 ) 

# 使 用 select () 方 法 ， 参 数 是 下 拉 列 表 的 值 或 索引 

dlg spec.ComboBox.select (2) 

dlg_spec.ComboBox.select (' 广 东 省 ') 

# 获取 下 拉 框 comboBox 的 数据 

print (' 下 拉 框 ComboBox 的 全 部 数据 : '，dlg_spec.ComboBox.texts ()) 
# 获取 当前 下 拉 框 所 选 的 数据 

print (' 当 前 下 拉 框 所 选 的 数据 : '，dlg_spec.ComboBox.window text() ) 
time.sleep (1) 


# 选择 下 拉 框 comboBox 的 数据 (所 在 城市 ) 

dlg spec.ComboBox2.select (2) 

# 在 下 拉 框 ComboBox 写 入 数据 

dlg spec.ComboBox2.Edit2.set edit text (' 珠 海 市 ') 

# 获取 下 拉 框 ComboBox 的 数据 

print (" 下 拉 框 ComboBox 的 全 部 数据 : '，dl1g_spec.ComboBox2.texts()) 
# 获取 当前 下 拉 框 所 选 的 数据 

print (' 当 前 下 拉 框 所 选 的 数据 : '， dlg_spec.ComboBox2.window text()) 
time.sleep(1) 
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最 后 实现 wxGUI 的 勾 选 框 和 按钮 的 单 击 和 读 取 操 作 ， 两 个 控件 也 是 使 用 clickO、 
click input0 和 window_text()、texts0 方 法 实现 单 击 和 读 取 ， 实 现代 码 如 下 : 


# 单 击 勾 选 框 

dlg spec .我 已 阅读 有 关 事 项 Button.click() 

dlg_spec .我 已 阅读 有 关 事 项 Button.click input() 

# 读 取 勾 选 框 数 据 

print (' 勾 选 框 数据 :'，d1lg_spec .我 已 阅读 有 关 事 项 Button.window text ()) 
print (' 勾 选 框 数据 :'，d1lg_spec .我 已 阅读 有 关 事项 Button .texts () ) 
time.sleep (1) 


# 单 击 注册 按钮 

dlg_spec. 注 册 Button.click() 

dlg spec. 注 册 Button.click input () 

# 读 取 注 册 按钮 数据 

print ( "注册 按钮 数据 : '，d1lg_spec. 注 册 Button.window text ()) 
print (' 注 册 按 钮 数据 :，'，d1lg_spec. 注 册 Button.texts ()) 
time.sleep (1) 


在 单 击 “ 注 册 ” 按 钮 的 时 候 ，wxGUI 会 弹出 一 个 新 的 提示 框 窗口 ， 如 图 11-17 所 示 。 
如 果 要 对 这 个 新 窗口 进行 自动 化 操控 ， 需 要 对 新 窗口 进行 绑 定 连接 ， 然 后 再 对 新 窗口 里 面 
的 控件 进行 定位 操作 。 

由 于 新 窗口 是 独立 于 wxGUI 的 主 程序 窗口 ， 所 
以 无 法 使 用 child_ window0 方 法 对 新 窗口 进行 绑 定 
连接 ， 只 能 使 用 window0 方 法 对 新 窗口 进行 绑 定 连 
接 ， 然 后 再 对 新 窗口 里 的 控件 进行 定位 操控 ， 具 体 
代码 如 下 : 图 11-17 提示 框 窗口 


# 绑 定 连接 提示 框 

msg = dlg.window (title_re=' 注 册 成 功 ') 
# 输出 提示 框 的 控件 信息 

msg.print control identifiers() 

# 单 击 "是 "按钮 

msg[' 是 (&Y)Button'] .click() 


上 述 代 码 中 ， 新 窗口 的 “是 ”按钮 在 PyWinAuto 里 面 的 命名 带 有 特殊 符号 “(&)”， 
如 果 使 用 “.” 定 位 方法 对 控件 进行 定位 则 会 提示 异常 信息 ， 所 以 只 能 使 用 “[]” 定 位 方 
法 ， 这 也 说 明 “ 口 ”定位 比 “.” 定 位 更 为 灵活 和 全 面 。 
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11.6 ”从 源码 剖析 PyWinAuto 


在 前 面 两 节 中 ， 分 别 介绍 了 uia 和 Win32 软件 的 自动 化 开发 。 通 过 这 些 内 容 介 绍 ， 主 
要 目的 是 让 读者 掌握 如 何 使 用 PyWinAuto 模块 开发 C/S 软件 自动 化 程序 ， 培 养 C/S 软件 的 


自动 化 开发 思维 。 在 本 节 中 ， 我 们 通过 剖析 PyWinAuto 的 源码 来 进一步 了 解 PyWinAuto。 

在 Python 的 安装 目录 下 打开 PyWinAuto 的 源码 文件 夹 (Lib\site-packages\pywinauto)， 
该 文件 夹 共 有 30 个 项 目 ， 对 于 PyWinAuto 的 使 用 者 来 说 ， 只 需 关 注 5 个 项 目的 源码 内 容 即 
可 ， 如 图 11-19 所 示 。 


vo 


pycache_ linux 
由 tests init_ 区 actionloggerpy 
区 applicationpy 


区 findbestmatch-py 


区 winazfunctionspy 


图 11-18 PyWinAuto 源码 结构 


图 11-18 中 展示 了 PyWinAuto 所 有 的 源码 文件 ， 在 开发 自动 化 程序 的 时 候 ， 很 多 
PyWinAuto 的 函数 方法 都 是 来 自 源码 的 controls、clipboardpy、keyboard.py、mouse py 和 
timings.py， 有 具体 说 明 如 下 。 


controls: 定义 软件 中 所 有 控件 类 及 控件 的 操作 方法 ， 这 是 实现 C/S 自 动 化 开发 的 核心 
代码 。 

clipboard.py: 控制 计算 机 的 剪贴 板 操 作 ， 目 前 只 提供 读 取 剪 贴 板 的 数据 功能 ， 等 同 于 
键盘 上 的 热 键 CtrlHV 的 功能 。 

keyboard.py: 控制 键盘 操作 ， 与 PyAutoGUI 控 制 键盘 的 原理 一 致 。 

mouse.py: 控制 鼠标 操作 ， 与 PyAutoGUI 控 制 筷 标 的 原理 一 致 。 

timings.py: 时 间 设 置 ， 主 要 协调 程序 运行 速度 与 计算 机 桌面 的 自动 化 执行 速度 ， 使 两 
者 尽量 同步 进行 ， 防 止 异常 产生 。 


我 们 打开 controls 文件 夹 ， 可 以 看 到 该 文件 夹 中 有 7 个 py 文件 ， 除 初始 化 文件 


init 


.py 之 外 ， 每 个 文件 负责 实现 不 同 的 功能 ， 具 体 说 明 如 下 。 


作用 以 及 所 定义 的 类 与 方法 。 在 查看 源码 的 时 候 ， 无 需 细致 解读 每 个 类 及 每 个 方法 的 实现 
过 程 ， 只 需 关 注 每 个 类 继承 哪个 父 类 、 了 解 每 个 类 定义 了 哪些 类 方法 以 及 一 些 注释 说 明 
即 可 。 
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e hwndwrapper.py: 定义 控件 的 基本 操作 ， 其 中 HwndWrapper 类 封装 了 许多 底层 Windows 
API 的 功能 ， 大 多 数控 件 的 自动 化 操控 都 是 继承 HwndWrapper 类 ， 而 HwndWrapper 的 父 


类 是 BaseWrapper。 


@ common controls.py: 定义 Windows 公 共 控 件 的 类 ， 如 工具 栏 、 状 态 栏 及 选项 卡 等， 该 


文件 中 定义 的 类 大 多 数 继承 于 hwndwrapper.py 的 HwndWrapper 类 。 

e menuwrapper.py: 定义 菜单 控件 类 和 自动 化 操控 方法 。 

e ”uiawrapper.py: 定义 uia 特 有 的 控件 的 基础 类 UIAWrapper， 继 承 于 BaseWrapper 类 。 

e@ uia_controls.py: 定义 uia 特 有 的 控件 类 及 控件 操控 方法 ， 如 下 拉 框 和 ListVIEW 控 件 等 
文件 中 所 有 的 类 都 继承 于 uiawrapper.py 的 UIAWrapper 类 。 

@ ”win32_controls.py: 定义 Win32 的 控件 类 及 控件 操控 方法 ， 如 下 拉 框 、 按 钮 和 ListBox 
件 等 ， 文件 中 所 有 的 类 都 是 继承 于 hwndwrapper.py 的 HwndWrapper 类 。 


读者 如 果 只 看 上 述说 明 而 不 结合 文件 的 源码 内 容 ， 会 难以 明白 每 个 文件 之 间 的 关系 与 


La 


最 后 关于 clipboard.py、keyboard.py、mousepy 和 timings.py 的 源码 解读 ， 每 个 文件 


的 


功能 都 是 以 函数 的 方式 实现 ， 在 开发 自动 化 程序 中 ， 只 需 直接 调用 函数 并 设置 相关 的 函数 
即 可 。 至 于 每 个 功能 的 作用 和 使 用 方法 ， 读 者 可 以 查看 源码 的 注释 说 明 ， 每 个 源码 文 
注释 说 明 都 是 非常 清晰 易 懂 。 除 了 源码 之 外 ，PyWinAuto 的 官方 文档 也 列 出 了 每 种 不 


参数 
件 的 


同类 型 的 控件 可 


controls_overview.html 即 可 ， 本 书 就 不 再 一 一 讲述 。 
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新 闻 稿 的 内 容 格式 都 固定 不 变 。 如 果 这 项 工作 由 人 工 完成 ， 会 发 现 每 份 新 闻 稿 的 转换 操作 


都 具 


又 。 
头 是 


.7 ”实战 : 自动 撰写 新 闻 稿 


方法 ， 在 浏览 器 上 访问 https://pywinauto.readthedocs.io/en/latest/ 


通过 前 面 的 学 习 ， 相 信 读 者 对 PyWinAuto 已 有 大 致 的 了 解 ， 本 节 通 过 实战 项 目 来 进 一 
步 讲 述 PyWinAuto 的 使 用 。 本 项 目 中 有 多 份 txt 格式 的 新 闻 稿 需要 转换 成 Word 文档 ， 每 份 


有 重复 性 ， 因 此 可 以 使 用 PyWinAuto 实现 新 闻 稿 的 自动 撰写 。 


在 编写 自动 化 程序 之 前 ， 需 要 深入 了 解 新 闻 稿 从 txt 转换 成 Word 文档 的 具体 操作 步 


比如 新 闻 标题 的 字体 大 小 设置 、 是 否 加 粗 和 居中 ; 新 闻 内 容 的 字体 设置 、 每 个 段落 


否 缩 进 等 详细 的 转换 要 求 。 本 项 目 中 ， 具 体 的 转换 要 求 如 图 11-19 所 示 。 
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Ee 


图 11-19 新 闻 稿 格式 转换 要 求 


从 图 上 的 转换 要 求 分 析 可 得 ， 完 整 的 新 闻 稿 格式 转换 一 共 涉 及 了 6 个 操作 步骤 ， 有 具体 
说 明 如 下 : 


(1) 读 取 所 有 txt 文件 的 文件 路 径 ， 用 于 读 取 文件 内 容 和 提取 标题 。 

(2) 使 用 PyWinAuto 打开 新 的 Word 文档， 并 对 该 文档 绑 定 连 接 。 

(3) 在 Word 文档 里 ， 设 置 标题 格式 居中、 字体 大 小 为 四 号 并 加 粗 ， 提取 txt 文件 名 
作为 标题 内 容 。 

(4) 新 闻 内 容 的 段落 是 根据 txt 的 换行 符 进行 划分 ， 在 Word 文档 里 ， 设 置 新 闻 内 容 的 
格式 并 读 取 txt 文件 内 容 ， 在 写 入 Word 文档 时 ， 每 个 段落 的 开头 需要 tab 缩 进 。 

(5) 在 新 闻 内 容 下 方 插入 一 张 图 片 ， 图 片 位 置 居中 处 理 。 

(6) 将 新 闻 稿 另存 为 Word 文档 ， 文 件 名 使 用 默认 值 ， 文 件 保存 路 径 选 择 在 计算 机 的 桌 


Bs 


根据 上 述 分 析 ， 可 根据 操作 步骤 来 实现 相应 的 功能 代码 。 首 先 读 取 所 有 txt 文件 的 文件 
路 径 ， 我 们 把 这 个 功能 封装 在 一 个 fle_name 函数 中 ， 函 数 的 代码 如 下 : 


import os 
# 获取 文件 夹 的 所 有 txt 文件 路 径 
def file name(file dir): 
temp = [] 
for root, dirs, files in os.walk(file dir): 
for file in files: 
if os.path.splitext (file) [1] == '.txt"': 
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temp .append (os.path.join(root, file)) 
return 七 emp 
file path = r'C:\Users\000\Desktop\article' 
file list = file name (file path) 


函数 file name 只 需 传 入 目标 文件 夹 的 路 径 即 可 获取 目标 文件 夹 下 所 有 txt 的 文件 路 
径 ， 并 且 将 这 些 文 件 路 径 以 列表 的 形式 返回 。 整 个 函数 的 功能 都 是 由 Python 的 标准 库 os 实 
现 的 ， 标 准 库 os 提供 了 非常 丰富 的 方法 用 来 处 理 文件 和 目录 。 

下 一 个 操作 流程 是 使 用 PyWinAuto 打开 新 的 Word 文档 ， 并 对 Word 文件 绑 定 连接 。 本 
书 的 Word 版 本 是 2016， 计 算 机 是 Win10 64 位 
的 操作 系统 ， 打 开 并 查看 Word 的 属性 ， 如 图 “| sm” wes 站 ”请 醒 | 砍 证 呈 
11-20 所 示 。 

在 使 用 PyWinAuto 编写 自动 化 代码 之 前 ， 
首先 须 分析 Word 的 软件 类 型 ， 使 用 Inspect 和 
UISpy 进行 检测 ， 发 现 它 是 属于 uia 类 型 的 软 
件 。 然 后 使 用 PyWinAuto 的 start() 方 法 创建 一 个 
新 的 Word 文档， 再 由 window() 方 法 将 文档 进行 
绑 定 与 连接 ，Word 文档 界面 如 图 11-21 所 示 。 图 11-20 Word 软件 属性 


登录 以 充分 利用 Office ®@ 
MWA/elre| 了 Beame 轩 


Office16 


“Cprogram Files\Microsoft Office\root\Office]| 


最 近 使 用 的 文档 搜索 联 让 模板 -| 


于 的 要 起 : 业务” 纹 线 ” 渗 动 。 卡 。 救 育 “全 耳 简历 和 求职 信 


图 11-21 Word 文 档 界面 


在 Word 文档 界面 中 ， 只 要 单 击 “ 空 白文 档 ” 就 会 进入 文档 的 编辑 界面 。PyWinAuto 
实现 这 个 单 击 过 程 需要 定位 “空白 文档 ”的 控件 命名 ， 控 件 命名 可 以 通过 
print_control identifiers(0) 方 法 获取 ， 最 后 在 这 些 信 息 中 找到 “空白 文档 ”的 命名 ， 如 图 
11-22 所 示 。 综 合 分 析 ， 整 个 操作 流程 的 代码 如 下 所 示 : 
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word path = r"C:\Program Files\Microsoft Office\root\Officel6\WINWORD.EXE" 
app = Application (backend='uia') .start (word path) 

# 绑 定 连接 Word 窗口 

dlg spec = app-.window (class name='OpusApp') 

dlg spec.print control identifiers() 

# 单 击 打 开 空白 文档 

dlg_spec .空白 文档 ListItem.click input() 


child_window(titlen "发送 愁眉 苦 栓 "，control_typer Button ) 


ListBox - “特别 推荐 " (L363, T565, R965, B4217) 
[特别 推荐 ListBox"，' 特别 推荐 "，'ListBox2" ] 
child_window(title=“ 特 别 推荐 "，control_type="List”) 
| 
中 ListItem -“ 空 白文 档 (L364, T566, R586, B818) 
中 [空白 文档 ，'ListItem5' ，" 空白 文档 ListItem' ] 
上 child_window(title=“ 空 白文 档 "，auto_id=“AIOStartDocument”，control_type=“ListItem”)| 
| 
| ListItem -“ 书 法 字帖 " (L590, T566, R812, B818) 
| [ 书法 字帖 ListItem" ，' 书法 字帖 " ，" ListItem6 ' ] 
| child_window(title="“ 书 法 字帖 ”，auto_id=“AI0StartDocument”，control_type="ListItem”) 


图 11-22 查找 “空白 文档 ”的 命名 


进入 了 Word 文 档 的 编辑 界面 后 ， 在 Word 的 功能 区 分 别 单 击 加 粗 按 钮 、 居 中 按钮 和 字 
体 增 大 按钮 ， 并 且 提 取 txt 文 件 名 输入 到 Word 文 档 ， 作 为 该 文档 的 标题 ， 如 图 11-23 所 示 。 


年 5 -四 "| 过 四 上 | AsBbCcD| AaBbccD 

| 六 aBbCcD, cD 

和 站 册 | A .正文 | 。 无 是 
"Aa 固 *x @ QR- ||s 


# = 本 
图 11-23 设置 新 闻 标题 格式 
标题 完成 输入 后 ， 下 一 步 是 输入 正文 内 容 。Word 文档 换行 只 要 按 回 车 键 即 可 实现 ， 


PyWinAuto 有 模拟 用 户 操 作 键 盘 的 方法 。 换 行 之 后 ， 新 的 空白 行 还 保留 着 标题 的 格式 设 
置 ， 因 此 我 们 需要 单 击 加 粗 按钮 、 左 对 齐 按钮 和 字体 缩小 按钮 ， 这 样 可 以 取消 标题 的 格式 
设置 。 在 输入 正文 内 容 的 时 候 ， 根 据 文本 内 容 的 换行 符 来 划分 段落 ， 段 落 的 划分 可 以 使 用 
字符 串 的 split0 方 法 实现 。 综 上 所 述 ， 新 闻 稿 自动 撰写 的 功能 代码 如 下 : 

# 撰写 新 闻 标题 ， 并 设置 格式 

dlg spec. 加 粗 .click input() 

dlg_spec. 增 大 字号 .click input (double=True) 

dlg_spec. 居 中 .click input() 

ELSE dD Ne 
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dlg spec.Edit.type keys (title) 
time.sleep(0.2) 


# 换行 并 设置 正文 内 容 格式 
SendKeys (' {ENTER}') 
dlg_spec-. 加 粗 .click input () 
time.sleep (1) 
dlg_spec .缩小 字号 .click input (double=True) 
time.sleep (1) 
dlg spec.- 左 对 齐 .click input () 
输入 新 闻 内 容 
f = open(file name, 'r') 
text = f.read() 
f.close() 
Eo kK Ln toxta SplitA Nn 
# 判断 内 容 是 否 为 空 
kip 
SendKeys (' {TAB}') 
dlg spec.Edit.type keys(k.strip()) 
SendKeys (' {ENTER}') 
time.sleep (0.2) 


下 面 讲述 PyWinAuto 实现 图 片 插入 功能 ， 在 Word 文档 中 插入 图 片 的 操作 步 又: 单 击 
“居中 ”按钮 一 单 击 “ 插 入 ”选项 卡 一 单 击 “ 图 片 ”按钮 一 输入 图 片 的 路 径 一 单 击 “ 插 
入 ”按钮 。 整 个 步骤 都 以 按钮 单 击 为 主 ， 在 单 击 “图 片 ”按钮 的 时 候 ，Word 会 弹出 一 个 子 
窗口 “插入 图 片 对 话 框 ”， 对 于 子 窗口 可 以 使 用 child_window0 实 现 绑 定 与 连接 。 有 具体 的 
功能 代码 如 下 : 


插入 图 片 

dlg_spec. 居 中 .click input() 

dlg_spec. 插 入 .click input() 

# 重新 捕捉 软件 控件 信息 

dlg spec.print control identifiers() 
dioqnspecl ge Buttonvl eenpatl) 

# 进入 图 片 对 话 框 

fileDialog = dlg_ spec.-child window (title=' 插 入 图 片 ') 
# 查看 子 窗口 控件 信息 

# fileDialog.print control identifiers () 
# 设置 等 待 时 间 ， 等 待 文件 选择 框 出 现 


fileDialog.wait ('enabled', timeout=300) 
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# 判断 文件 选择 框 是 否 出 现 

if fileDialog.is_enabled() : 
pic path = Fr"C:\Users\000\Desktop\article\logo.jpg" 
fileDialog.Edit.set edit text (pic path) 
fileDialog.SsplitButton2.click input() 


上 述 代码 中 ， 使 用 “图 片 ..Button ”来 定位 图 片 按钮 ， 当 单 击 “插入 ”选项 卡 的 时 
候 ，Word 的 功能 区 会 发 生变 化 ， 这 是 因为 每 个 选项 卡 都 有 自己 的 特定 功能 ， 只 要 软件 的 控 
件 发 生变 化 ，PyWinAuto 都 会 对 软件 控件 进行 重新 捕捉 。 

举 个 例子 ， 比 如 单 击 “ 开 始 ”选项 卡 的 时 候 ，PyWinAuto 捕捉 的 “开始 ”选项 卡 下 
罗 加 粗 按钮 和 居中 按钮 等 控件 信息 ， 但 无 法 捕捉 “插入 ”选项 卡 的 图 片 按钮 ， 只 有 
“插入 ”选项 卡 ，Word 界面 发 生变 化 ，PyWinAuto 会 对 软件 的 控件 进行 重新 捕捉 。 
代码 中 还 使 用 wait0 和 is_enabled0) 方 法 。wait0 是 等 待 子 窗口 “插入 图 片 对 话 框 ”的 出 
现 ， 参 数 timeout 是 等 待 时 间 ; is_enabled0 是 判断 子 窗 口 “插入 图 片 对话 框 ”是 否 处 于 可 编 
辑 状态 ， 返 回 结果 是 True 或 False。 
最 后 一 步 是 实现 文件 的 保存 ， 文 件 保存 通过 单 击 “ 文 件 ” 选 项 卡 一 单 击 “ 另 存 为 ”一 
单 击 “ 桌 面 ” 一 单 击 “ 保 存 ”。 具 体 的 操作 过 程 如 图 11-24 所 示 ， 相 应 的 功能 代码 如 下 
所 示 : 


此 


而 


已 固定 
国定 所 村 文件 去, 方便 以 后 查找 。 饼 标 县 停 在 基 个 文件 夹 
上 方 时 ， 单 去 显示 的 图 休 图 标 . 


(OD Ri 


人 全 oneDrive 


文件 各 (N): | 专家 解 半 新 个 入 法 : 碱 侣 后 个 税 名 担 减 经 了 多 少 ?_docx 
保存 类 型 (): Word 文档 (".docg 


口 人 ss 加 


图 11-24 文档 另存 为 
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# 文件 另存 为 

dlg spec[" “文件 “选项 卡 Button'] . click input() 
# 查看 窗口 控件 变化 情况 

# dlg spec.print control identifiers() 

dlg spec. 另 存 为 ListItem.click input() 
dlg_spec. 桌 面 ListItem.click input () 
dlg_spec[' 保 存 (S)Button'] .click input() 

# 关闭 Word 文档 
dlg_spec. 关 闭 Button3.click input() 


上 述 全 部 代码 只 是 实现 了 单个 txt 文件 转换 为 Word 文档 ， 若 存在 多 个 txt 文件 需要 转 
换 ， 只 需 在 上 述 代码 中 添加 一 个 循环 即 可 实现 。 读 者 在 运行 代码 的 时 候 ， 记 得 将 代码 中 的 
一 些 文件 路 径 改 为 自己 计算 机 的 路 径 信 息 。 至 此 ， 整 个 项 目的 完整 代码 如 下 所 示 : 


from pywinauto.application import Application 
from pywinauto.keyboard import SendKeys 
import time 
import os 
# 获取 文件 夹 的 所 有 txt 文件 路 径 
def file name (file dir) : 
temp = [] 
for root, dirs, files in os.walk(file dir): 
for file in files: 
if os.path.splitext (file) [1] == '.txt': 
temp.append (os.path.join(root, file)) 
return temp 
file path = r'C:\Users\000\Desktop\article"' 
file list = file name (file path) 


for i in file list: 
word path = r"C:\Program Files\Microsoft Office\root\Officelé6\ 
WINWORD .EXE" 
app = Application (backend="'uia') .start (word path) 
# 绑 定 连接 Word 窗口 
dlg_spec = app.window(class_name='OpusRAPP') 
# dlg_spec.print control identifiers() 
# 单 击 打 开 空白 文档 
dlg_spec .空白 文档 ListItem.click input() 


# 撰写 新 闻 标题 ， 并 设置 格式 
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dlg spec. 加 粗 .click input() 
# 设置 双 
dlg spec. 增 大 字号 .click input (double=True) 
dlg_spec. 居 中 .click input() 

Bitle = .pL NN EL pliLtt .rol 
dlg spec.Edit.type keys (title) 


Er 


time.sleep (0.2) 


## 换行 并 设置 正文 内 容 格式 
SendKeys (' {ENTER}') 
dlg_spec. 加 粗 .click input () 
time.sleep (1) 
# 设置 双击 
dlg spec. 缩 小 字号 .click input (double=True) 
time.sleep (1) 
dlg_spec. 左 对 齐 .click input () 
# 输入 正文 内 容 
f = open(i, 'r') 
text = f.read() 
f.close() 
for kk Ln ont. spllE tN 
# 判断 内 容 是 否 为 空 
LE SEE 全 
SendKeys (' {TAB}') 
dlg_spec.Edit.type keys(k.strip()) 
SendKeys (' {ENTER}') 
time.sleep (0.2) 


# 插入 图 片 

dlg spec. 居 中 .click input() 

dlg_spec. 插 入 .click input () 

# 重新 捕捉 软件 控件 信息 

# dlg_spec.print_control identifiers() 
dlg_spec[' 图 片 .. .Button'] .click input () 

# 进入 图 片 对 话 框 

fileDialog = dlg_ spec.child window (title=' 插 入 图 片 ') 
# 查看 子 窗口 控件 信息 

# fileDialog.print control identifiers() 
# 设置 等 待 时 间 ， 等 待 文件 选择 框 出 现 


fileDialog.wait('enabled'，timeout=300) 
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判断 文件 选择 框 是 否 出 现 

if fileDialog.is_enabled() : 
pic path = rz'"C:\Users\000\Desktop\article\logo.jpg'" 
fileDialog.Edit.set edit text (pic path) 
fileDialog.SsplitButton2.click input() 


# 文件 另存 为 

dlg_spec[' "文件 "选项 卡 Button'] .click input () 
# 查看 窗口 控件 变化 情况 

# dlg spec.print control identifiers() 
dlg_spec. 另 存 为 ListItem.click input () 

dlg spec. 桌 面 ListItem.click input () 
dlg_spec[' 保 存 (S)Button'] .click input() 

# 关闭 Word 文档 

dlg_spec. 关 闭 Button3.click input() 


11.8 本章 小 结 


PyWinAuto 将 Windows 的 GUI 分 为 Win32 和 uia 两 种 情形 ， 这 是 由 于 Microsoft 平台 
开发 的 C/S 应 用 程序 底层 原理 不 同 的 原因 ， 两 者 的 实现 原理 分 别 基 于 Win32 API 和 MS 
UI， 这 也 是 Microsoft 平台 应 用 程序 的 底层 接口 。Win32 支持 MFC、VB6、VCL、 简 单 的 
WinForms 控件 和 大 多 数 旧 的 应 用 程序 ，uia 则 支持 WinForms、WPF 和 Qts 等 。 

使 用 PyWinAuto 模块 开发 C/S 软件 自动 化 程序 的 实现 过 程 如 下 : 


(1) 了 解 开发 需求 ， 掌 握 软件 操作 顺序 ， 比 如 从 哪儿 开始 、 单 击 的 顺序 、 文 本 输入 内 
容 等 详细 的 需求 说 明 。 

(2) 确定 软件 类 型 一 一 通过 辅助 工具 分 析 软 件 及 控件 信息 。 

《3) 根据 软件 类 型 进行 Application 类 实例 化 ， 连 接 目标 软件 的 主 窗口 并 输出 软件 的 控 
件 信息 。 

(4) 从 输出 的 控件 信息 查找 控件 命名 ， 通 过 这 些 命 名 定位 目标 控件 ， 可 以 使 用 “.” 定 
位 或 者 使 用 “ 口 ”定位 。 

(5) 控件 定位 后 ， 对 控件 使 用 相应 的 操控 方法 ， 比 如 单 击 、 文 本 输入 、 双 击 以 及 勾 选 
操作 等 。 
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在 PyWinAuto 的 源码 文件 中 ， 自 动 化 操控 方法 都 来 自 源码 的 controls、clipboard.py、 
keyboard.py、mouse.py 和 timings.py， 具 体 说 明 如 下 。 


@ controls: 定义 软件 中 的 所 有 控件 类 及 控件 的 操作 方法 ， 这 是 实现 C/S 自 动 化 开发 的 核 
心 代码 。 

。 clipboard.py: 控制 计算 机 的 剪贴 板 操 作 ， 目 前 只 提供 读 取 剪贴 板 的 数据 功能 ， 等 同 键 
盘 热 键 CtrltV 的 功能 。 

® keyboard.py: 控制 键盘 操作 ， 与 PyAutoGUI 控 制 键盘 的 原理 一 致 。 

emouse.py: 控制 鼠标 操作 ， 与 PyAutoGUI 控 制 筷 标 的 原理 一 致 。 

e timings.py: 时 间 设置 ， 主 要 协调 程序 运行 速度 与 计算 机 桌面 的 自动 化 执行 速度 ， 使 两 
者 尽量 同步 进行 ， 防 止 异常 产生 。 


图 像 识别 与 定位 


本 章 讲述 人 工 智 能 的 计算 机 视觉 领域 一 一 利用 OpenCV 实现 图 像 识别 与 定位 。 由 于 
PyAutoGUI 是 通过 图 像 的 简单 识别 进行 定位 ， 为 了 提高 图 像 识别 的 准确 率 ， 将 OpenCYV 与 
PyAutoGUI 相互 结合 使 用 ， 可 以 提高 系统 自动 化 的 稳定 性 。 


12.1 OpenCV 概述 及 安装 


人 工 智能 (Artificial Intelligence) ， 英 文 缩写 为 AI。 它 是 研究 开发 用 于 模拟 、 延 伸 和 
扩展 人 的 智能 的 理论 、 方 法 、 技 术 及 应 用 系统 的 一 门 新 的 学 科 ， 研 究 的 领域 包括 机 器 人 、 
语言 识别 、 图 像 识 别 和 自然 语言 处 理 等 。 

本 章 主要 讲述 人 工 智 能 的 图 像 识别 技术 ， 这 门 技术 也 称 为 计算 机 视觉 ， 我 们 利用 这 个 
技术 来 识别 计算 机 里 面 的 某 个 图 标 所 在 的 位 置 ， 从 而 实现 自动 化 开发 。 计 算 机 视觉 比 
PyAutoGUI 的 图 像 识别 更 智能 ， 前 者 可 以 在 不 同 分 辨 率 中 实现 目标 识别 ， 而 后 者 只 能 在 同 
一 分 辨 率 中 实现 目标 识别 。 

OpenCV 是 一 个 基于 BSD 许 可 (开源 ) 发 行 的 跨 平 台 计 算 机 视觉 库 ， 可 以 运行 在 Linux、 
Windows、Android 和 Mac OS 操作 系统 上 。 它 是 由 一 系列 的 C 函数 和 少量 C++ 类 构成 ， 同 
时 提供 Python、Ruby、Matlab 等 语言 的 接口 ， 实 现 了 图 像 处 理 和 计算 机 视觉 方面 的 很 多 通 
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用 算法 。 

OpenCV 的 主要 应 用 领域 有 人 机 互动 、 物 体 识 别 、 图 像 分 割 、 人 脸 识别 、 动 作 识别 、 
运动 跟踪 、 机 器 人 、 运 动 分 析 、 机 器 视觉 、 结 构 分 析 和 汽车 安全 驾驶 。 每 个 应 用 领域 都 涉 
及 多 种 算法 及 复杂 的 计算 ， 而 本 章 实 现 的 图 像 识 别 功能 ， 主 要 使 用 OpenCV 的 图 像 特 征 检 
测算 法 与 图 像 匹配 算法 。 

特征 检测 是 计算 机 对 一 张 图 像 中 最 为 明显 的 特征 进行 识别 检测 并 将 其 勾画 出 来 ， 大 多 
数 特征 检测 都 会 涉及 图 像 的 角 点 、 边 和 斑点 识别 或 者 对 称 轴 。 图 像 特征 检测 算法 主要 有 和 角 
点 检测 、SIFT 检测 、SUREF 检测 和 ORB 检测 。 

图 像 匹配 是 通过 对 两 张 或 以 上 的 图 像 内 容 、 特 征 、 结 构 、 关 系 、 纹 理 及 灰 度 等 对 应 关 
系 的 相似 性 和 一 致 性 进行 分 析 ， 找 出 图 像 之 间 相 似 的 位 置 。 图 像 匹配 算法 主要 有 暴力 匹配 
和 FLANN 匹配 。 

在 讲述 OpenCV 的 图 像 特 征 检测 算法 与 图 像 匹 配 算法 之 前 ， 需 要 安装 OpenCV 库 。 
Python 的 OpenCV 库 分 为 opencv-python 和 opencv-contrib-python， 后 者 是 在 前 者 的 基础 上 
进行 了 功能 扩展 ， 而 图 像 识别 中 的 特征 点 检测 和 匹配 在 opencv-contrib-python 库 里 ， 因 此 下 
一 步 讲述 opencv-contrib-python 的 安装 过 程 。 

opencv-contrib-python 的 安装 可 以 使 用 pip 指令 完成 。 目 前 opencv-contrib-python 的 最 新 
版 本 为 3.4.3.18， 但 新 版 本 在 使 用 特征 点 检测 算法 的 时 候 会 提示 异常 信息 ， 这 应 该 是 新 版 本 
的 bug， 只 能 等 待 官方 修复 ， 而 旧版 本 不 存在 这 个 问题 。 因 此 本 书 以 旧版 本 3.4.2.17 为 例 ， 
安装 指令 如 下 : 


pip install opencv-contrib-python==3.4.2.17 


如 果 因 网 络 过 慢 ， 导 致 pip 在 线 安装 失败 ， 可 以 下 载 whl 文件 ， 然 后 在 终端 使 用 pip 指令 
安装 whl 文件 ， 通 过 浏览 器 访问 https://pypi.org/project/opencv-contrib-python/3.4.2.17/#files， 
找到 与 Python 版 本 相对 应 的 whl 文件 。 本 书 以 计算 机 64 位 、Python3.7 为 例 ， 那 么 
opencv-contrib-python 的 whl 文件 为 opencv_contrib python-3.4.2.17-cp37-cp37m-win_amd64.whl。 
文件 下 载 后 ， 首 先 打 开 CMD 窗口 ， 然 后 访问 whl 文件 的 路 径 ， 最 后 输入 pip 安装 指令 ， 具 
体 安装 过 程 如 下 : 

# 访问 whl 文件 的 路 径 

C:\Users\000>cd C:\Users\000\Downloads 


# pip 安装 指令 
C:\Users\000\Downloads>pip install opencV contrib python-3.4.2.17-cp37 


-cp37m-win amd64.whl 


完成 opencv-contrib-python 的 安装 后 ， 在 CMD 窗口 上 进入 Python 的 交互 模式 来 验证 是 
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否 安 装 成 功 ， 具 体 的 验证 方法 如 下 : 


C:\Users\000>python 
SS Lmport ICw2 

>>> cv2. version 
ey 


12.2 图像 特征 点 检测 算法 


OpenCV 的 图 像 特 征 点 检测 算法 主要 有 角 点 检测 、SIFT 检测 、SURF 检测 和 ORB 检 
测 。 而 角 点 检测 在 图 像 识别 的 作用 不 大 ， 本 书 不 做 详细 介绍 。 我 们 重点 介绍 SIFT 检测 、 
SURF 检测 和 ORB 检测 的 使 用 ， 至 于 检测 算法 涉及 到 的 高 等 数学 原理 ， 本 书 也 不 做 详细 介 
绍 ， 有 兴趣 的 读者 可 以 自行 网 上 查阅 相关 资料 。 

SIFT 的 全 称 是 (Scale Invariant Feature Transform) 尺度 不 变 特征 变换 ， 上 
David G.Lowe 提出 。SIFT 特征 对 旋转 、 尺 度 缩放 、 亮 度 变化 等 保持 不 变性 ， 是 一 种 非常 稳 
定 的 局 部 特征 ， 它 具有 以 下 特点 : 


(1) 图 像 的 局 部 特征 ， 对 旋转 、 尺 度 缩放 、 亮 度 变 化 保持 不 变 ， 对 视角 变化 、 仿 射 变 
换 、 噪 声 也 保持 一 定 程度 的 稳定 性 。 

(2) 独特 性 好 ， 信 息 量 丰 富 ， 适 用 于 海量 特征 库 进 行 快速 、 准 确 的 匹配 。 

(3) 多 量 性 ， 即 使 是 很 少 几 个 物体 也 可 以 产生 大 量 的 SIFT 特征 。 

(4) 高 速 性 ， 经 优化 的 SIFT 匹配 算法 甚至 可 以 达到 实时 性 。 

(5) 扩展 性 ， 可 以 很 方便 地 与 其 他 的 特征 向 量 进行 联合 。 


根据 SIFT 的 特点 描述 ， 可 能 有 些 读 者 很 难 理解 其 具体 意思 ， 简 单 地 用 一 句 话 总 结 ， 图 
像 好 比 一 个 人 ,每 个 人 都 有 自己 的 特征 ， 我 们 可 以 通过 人 的 特征 识别 区 分 每 个 人 ; 图像 也 
是 如 此 ，SIFT 算法 就 是 把 图 像 的 特征 检测 出 来 ， 通 过 这 些 特征 可 以 在 众多 的 图 片 中 找到 相 
应 的 图 片 。 下 面 讲述 SIFT 算法 的 使 用 ， 以 某 图 片 为 例 ， 具 体 代 码 如 下 : 


import cv2 

# 读 取 图 片 

img = cv2.imread('logo.png') 

# 定义 SIFT 对 象 

sift = Cv2.xfeatures2d.SIFT create() 


# 检测 关键 点 并 计算 描述 符 
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# 描述 符 是 对 关键 点 的 描述 ， 可 用 于 图 片 匹配 


keypoints, descriptor = sift.detectAndCompute (img, None) 


# 将 关键 点 勾画 到 图 片上 

flags = cv2.DRAW MATCHES FLAGS DEFAULT 

calor = {00 25572 0 

img = cv2.drawKeypoints (image=img, outImage=img, 


keypoints=keypoints, flags=flags, color=color) 


# 显示 图 片 
cv2.imshow('sift keypoints', img) 
cv2 .waitKey () 


上 述 代 码 按照 功能 的 不 同 来 进行 划分 : 图 片 的 SIFT 特 征 检测 、 在 图 片上 勾画 关键 点 及 
图 片 显示 。 详 细 的 说 明 如 下 。 


1. 图 片 的 SIFT 特 征 检测 


首先 使 用 OpenCV 读 取 图 片 并 生成 img 对 象 ， 然 后 定义 sift 对 象 ， 再 从 sift 对 象 中 调用 
detectAndCompute() 方 法 计算 img 对 象 的 关键 点 和 描述 符 。 

关键 点 是 图 片 特征 点 所 在 的 位 置 ， 不 同 图 片 的 关键 点 各 不 相同 。 描 述 符 是 以 多 维度 的 
数组 来 描述 图 像 的 关键 点 ， 每 一 个 描述 符 对 应 一 个 关键 点 ， 而 多 维度 数组 的 生成 是 由 
Python 的 numpy 库 实现 。 


2. 在 图 片上 勾画 关键 点 


在 图 片上 勾画 关键 点 , 可 以 更 好 地 展示 SIFT 算法 行 迹 ， 这 个 勾画 过 程 是 由 OpenCYV 的 
drawKeypoints() 方 法 实现 的 ， 该 方法 的 参数 说 明 如 下 : 


(1) 参数 image 代表 原始 图 片 。 

(2) 参数 outImage 是 指 输出 在 哪 张 图 片上 。 

(3) 参数 keypoints 代表 图 片 的 关键 点 。 

(4) 参数 flags 是 关键 点 的 勾画 方式 ， 上 述 代码 使 用 默认 参数 ， 即 对 关键 点 所 在 的 位 
置 画 出 了 圆 的 中 心 点 ， 如 果 用 cv2.DRAW_MATCHES FLAGS DRAW RICH KEYPOINTS， 
则 以 另 一 种 方式 勾画 出 来 。 

(5) 参数 color 代表 勾画 的 色彩 模式 ， 以 Python 的 元 组 表示 ， 元 组 的 元 素 依次 代表 
RGB 颜色 通道 。 
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3. 图 像 显示 


OpenCV 的 imshow0 和 waitKey0 方 法 实现 ， 两 个 方法 
必须 同时 使 用 ， 如 果 只 使 用 imshow0 方 法 ， 程 序 在 运行 过 程 
中 ， 图 片 只 会 一 闪 而 过 ; imshow0 的 参数 分 别 代 表 图 片 窗 
内 命名 和 图 片 对 象 。 上 述 代码 的 运行 结果 如 图 12-1 所 示 。 
由 于 SIFT 的 实时 性 较 差 ， 并 且 对 于 边缘 光滑 目标 的 特征 
点 检测 能 力 较 弱 ， 因 此 David Lowe 在 1999 年 提出 了 SURF 
算法 ， 这 是 对 SIFT 算法 的 改进 ， 提 升 了 算法 的 执行 效率 。 与 
SIFT 算法 一 样 ，SURF 算法 可 以 分 为 三 大 部 分 : 局 部 特征 点 
的 检测 、 特 征 点 的 描述 和 特征 点 的 匹配 。 

OpenCV 的 SURF 与 SIFT 的 使 用 方法 十 分 相似 ， 以 上 述 图 12-1 SIFT 特征 检测 
代码 为 例 ， 把 代码 的 SIFT 算法 改 为 SURF 算法 : 


可 瑟 


import cv2 

# 读 取 图 片 

img = cv2.imread('logo.png') 

# 定义 SURF 对 象 ， 参 数 float (1000) 为 闵 值 ， 闵 值 越 高 ， 识 别 的 特征 越 小 。 
Surf = cv2.xfeatures2d.SURF create (float (1000)) 

# 检测 关键 点 并 计算 描述 符 

# 描述 符 是 对 关键 点 的 描述 ， 可 用 于 图 片 匹 配 


keypoints, descriptor = surf.detectAndCompute (img, None) 


# 将 关键 点 勾画 到 图 片上 

flags = cv2.DRAW MATCHES FLAGS DEFAULT 

color =: (0 255 1) 

img = cv2.drawKeypoints (image=img, outImage=img, 
keypoints=keypoints, flags=flags, color=color) 


# 显示 图 片 
cv2.imshow('surf keypoints', img) 
cv2 .waitKey () 


从 SIFT 算法 代码 与 上 述 代码 对 比 发 现 ， 上 述 代 码 将 SIFT 对 象 改 为 SURF 对 象 ， 参 数 


float(1000) 是 设置 SURF 的 阔 值 ， 阔 值 越 高 ， 检 测 图 像 的 特征 点 越 小 。 代 码 运行 结果 如 图 
12-2 所 示 。 
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对 比 SURF 和 SIFT 算法 ，ORB 算法 才 处 于 起 步 阶 段 ， 其 于 2011 年 首次 发 布 ， 但 它 比 
前 两 者 的 速度 更 快 。ORB 采用 FAST (features from accelerated segment test) 算法 来 检测 特 
点 。FAST 的 核 ， 多 不 和 的 点 ， 即 每 一 个 点 跟 它 周 围 的 点 比较 ， 如 果 
它 和 其 中 大 部 分 的 点 都 不 一 样 就 可 以 认为 它 是 一 个 特征 点 。ORB 的 使 用 方法 与 SIFT 的 使 


全 


用 也 是 非常 相似 的 ， 有 具体 的 代码 如 下 所 示 ， 运 了 结果 如 图 12-3 所 示 。 


司 orb keypoints 一 


图 12-2 SUREF 特征 检测 图 12-3 ORB 特征 检测 


import cv2 

# 读 取 图 片 

img = cv2.imread('logo.png') 

# 定义 ORB 对 象 

orb = CV2.0RB create () 

# 检测 关键 点 并 计算 描述 符 

# 描述 符 是 对 关键 点 的 描述 ， 可 用 于 图 片 匹配 


keypoints, descriptor = orb.detectAndCompute (img, None) 


# 将 关键 点 勾画 到 图 片上 

flags = cv2.DRAW MATCHES FLAGS DEFAULT 

color = (0, 255, 0) 

img = cv2.drawKeypoints (image=img, outImage=img, 
keypoints=keypoints, flags=flags, color=color) 


# 显示 图 片 


cv2.imshow('orb keypoints', img) 
cv2 .waitKey () 


从 上 面 的 三 个 例子 可 以 看 到 ， 不 管 图 像 特 征 检测 算法 是 SURF、SIFT 还 是 ORB， 三 者 


的 使 用 方式 都 是 相似 的 。 图 像 特征 检测 结果 是 以 变量 keypoints 和 descriptor 表示 , keypoints 
代表 图 片 特征 关键 点 的 坐标 ， 也 是 图 片 里 的 某 些 像素 点 的 坐标 ， 并 且 这 些 像素 点 是 这 张 图 
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片 最 为 突出 的 特征 点 。descriptor 是 关键 点 的 描述 符 ， 以 多 维度 的 数组 来 描述 一 个 关键 点 ， 
多 维度 数组 由 Python 的 numpy 库 生 成 ， 描 述 符 主要 实现 图 像 之 间 的 匹配 。 


12.3 ”图像 匹配 与 定位 


在 上 一 节 中 ， 我 们 讲述 了 SURF、SIFT 和 ORB 算法 的 图 像 特 征 检测 ， 检 测 结果 以 变量 

keypoints 和 descriptor 表示 。 在 本 节 中 ， 利 用 图 像 特 征 的 keypoints 和 descriptor 来 实现 图 像 
的 匹配 与 定位 。 图 像 匹配 算法 主要 有 暴力 匹配 和 FLANN 匹配 ， 而 图 像 定 位 是 通过 图 像 匹 
配 结果 来 反 向 查询 它们 在 目标 图 片 中 的 具体 坐标 位 置 。 
以 QQ 登录 界面 为 例 ， 将 整个 QQ 登录 界面 保存 为 QQ.png 文件 ，QQ 登录 界面 是 在 计算 
机 的 1920X 1080 分 辨 率 下 截图 保存 的 ， 再 把 计算 机 的 分 辨 率 改 为 1280X1024， 将 QQ 登录 
界面 的 用 户头 像 保存 并 对 图 像 进行 旋转 处 理 ， 最 后 保存 为 portraitpng 文件 。 两 个 图 片 文件 如 
图 12-4 所 示 。 


图 12-4 QQ.png( 左 图 ) portraitpng ( 右 图 ) 


两 张 图 片 文件 的 像素 分 辨 率 和 图 像 位 置 都 发 生 了 变化 ， 如 果 要 通过 portraitpng 去 匹配 
定位 它 在 QQ.png 所 在 的 坐标 位 置 ， 自 动 化 工具 PyAutoGUI 肯定 是 无 法 实现 的 。 若 想 解 决 
这 种 复杂 的 图 像 识别 问题 ， 只 能 使 用 计算 机 视觉 技术 。 在 OpenCV 里 面 ，QQ.png 称 为 目标 
图 像 ，portrait png 称 为 训练 图 像 。 有 具体 的 实现 过 程 如 下 : 


(1) 分 别 对 两 张 图 片 的 图 像 进 行 特征 检测 ， 图 像 特 征 检测 算法 有 SURF、SIFT 和 
ORB， 两 张 图 片 必须 使 用 同一 种 特征 检测 算法 。 

(2) 根据 两 张 图 片 的 特征 描述 符 〈 即 变量 descriptor) 进行 匹配 ， 匹 配 算法 有 暴力 匹配 
和 FLANN 匹配 ， 不 同 的 匹配 算法 所 产生 的 匹配 结果 存在 一 定 的 差异 。 
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(3) 对 两 张 图 片 的 匹配 结果 进行 数据 清洗 ， 去 除 一 些 错误 匹配 。 错 误 匹 配 是 由 于 在 图 
片 不 同 区 域内 出 现 多 处 相似 的 特征 而 导致 的 。 

(4) 在 匹配 结果 里 抽取 中 位 数 ， 利 用 中 位 数 来 反 向 查询 它 在 目标 图 片 所 对 应 像素 点 的 
坐标 位 置 ， 这 个 坐标 位 置 也 是 自动 化 开发 中 使 用 的 图 片 定 位 坐标 。 


我 们 根据 这 4 个 过 程 所 实现 的 功能 来 编写 相应 的 代码 ， 代 码 的 图 像 特 征 检测 选择 SIFT 
算法 、 图 像 匹 配 算法 选择 FLANN 算法 ， 具 体 代码 如 下 : 


> 


import cv2 

"mw 实现 过 程 1""" 

imgl = cv2.imread('QQ.png') 

img2 = cv2.imread('portrait.png') 

# 使 用 SIFT 算法 获取 图 像 特征 的 关键 点 和 描述 符 

Sift = cv2.xfeatures2d.SIFT create() 

kpl, desl = sift.detectAndCompute (imgl, None) 
kp2, des2 = sift.detectAndCompute (img2, None) 


"mw 实现 过 程 2 """ 

# 定义 FLANN 匹配 器 

indexParams = dict(algorithm=0，trees=10) 

searchParams = dict(checks=50) 

flann = cv2.FlannBasedMatcher (indexParams, searchParams) 
# 使 用 KNN 算法 实现 图 像 匹配 ， 并 对 匹配 结果 排序 

matches = flann.knnMatch (desl, des2, k=2) 

matches = sorted(matches, key=lambda x: x[0].distance) 


Pum 实现 过 程 信 nn 
# 去 除 错误 匹配 ，0 .5 是 系数 ， 系 数 大 小 不 同 ， 匹 配 的 结果 也 不 同 
goodMatches = [] 
for m, n in matches: 
if m.distance < 0.5 * n.distance: 
goodMatches .append (m) 


"" ”实现 过 程 4 """ 

# 获取 某 个 点 的 坐标 位 置 

# index 是 获取 匹配 结果 的 中 位 数 

index = int(len(goodMatches)/2) 

# queryIdx 是 目标 图 像 的 描述 符 索 引 

XxX, y = kpl[goodMatches [index] .queryIdx] .pt 
# 将 坐标 位 置 勾画 在 gQ.png 图 片 并 显示 图 片 
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cv2.rectangle (imgl, (int (x), int(y)), (int(x) + 5, 
In TS tO 255 OF 2 

cv2.imshow('QQ', imgl1) 

cv2 .waitKey () 


上 述 代码 演示 了 SIFT 算法 和 FLANN 算法 的 使 用 ， 图 像 匹配 与 定位 离 不 开 这 些 算 
支持 。 在 OpenCV 中 使 用 FLANN 算法 需要 创建 FLANN 匹配 器 对 象 ， 
FlannBasedMatcher() 实 现 ， 该 方法 的 参数 说 明 如 下 : 
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法 的 


(1) 参数 indexParams 设置 指定 使 用 的 算法 及 配置 。 如 果 使 用 SURF 和 SIFT 算法 ， 参 
数值 可 以 按照 上 述 配置 使 用 ;如果 使 用 ORB 算法 ， 参 数值 应 改 为 dict(algorithm=6， 


table number=6, key_size=12, multi probe level=2)。 


(2) 参数 searchParams 设置 索引 树 被 遍历 的 次 数 ， 参 数值 越 高 ， 匹 配 结果 越 准确 ， 


是 消耗 的 时 间 也 越 多 。 


创建 FLANN 匹配 器 对 象 后 ， 在 该 对 象 中 调用 knnMatch() 方 法 即 可 进行 图 像 匹配 ， 


配 结果 以 列表 的 形式 表示 。 使 用 sorted0 函 数 对 匹配 结果 进行 排序 处 理 ， 排 序 条 件 根据 


结果 的 目标 图 像 的 distance 属性 值 大 小 进行 升序 排列 ，distance 代表 描述 符 之 间 的 距离 ， 


离 越 低 ， 说 明 特 征 越 相 似 。 

接着 对 排序 后 的 匹配 结果 进行 数据 清洗 。 由 于 每 一 条 匹配 数据 包含 了 两 张 图 片 的 
信息 ， 因 此 数据 清洗 是 根据 两 张 图 片 的 distance 属性 值 进 行 计算 并 排查 是 否 匹 配 错误 。 

在 清洗 后 的 匹配 结果 中 提取 中 位 数 ， 因 为 匹配 
结果 已 经 过 排序 和 清洗 ， 取 中 位 数 可 以 确保 这 条 数 『 RE 
据 一 定 出 现在 图 像 匹 配 的 中 心 位置 。 我 们 将 中 位 数 
的 坐标 位 置 展 示 在 目标 图 像 QQ.png 中， 运行 上 述 代 
码 可 以 看 到 企鹅 的 嘴巴 出 现 了 一 个 圆 点 ， 如 图 12-5 
所 示 。 

此 外 还 可 以 将 上 述 代 码 的 图 像 特征 检测 算法 改 
为 SURF 算法 或 ORB 算 法， 以 下 只 列 出 算法 修改 的 
部 分 代码 ， 如 果 需 要 完整 的 代码 可 以 在 源码 文件 里 
查看 ， 修 改 代码 如 下 : 图 12-5 图 像 识 别 与 定位 

# 源码 文件 SURF+FLANN .py 

# 在 上 述 代 码 中 """ 实现 过 程 1""" 的 SIFT 改 为 SURF 

## 使 用 SURF 算法 获取 图 像 特征 的 关键 点 和 描述 符 


Surf = cv2.xfeatures2d.SURF create (float (4000)) 


但 


匹 


匹配 
距 
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kp1，desl = surf.detectAndCompute (imgl, None) 
kp2, des2 = surf.detectAndCompute (img2, None) 


# 源码 文件 ORB+FLANN .py 

# 在 上 述 代码 中 """ 实现 过 程 1 "" "的 SIFT 改 为 ORB 

# 使 用 ORB 算法 获取 图 像 特征 的 关键 点 和 描述 符 

orb = Cv2.0RB create() 

KE dest orb.detectAndCompute (imgl, None) 
kp2, des2 = orb.detectAndCompute (img2, None) 

# 在 上 述 代 码 中 """ 实现 过 程 2 """ 的 代码 全 改 为 以 下 代码 

# 定义 FLANN 匹配 器 

indexParams = dict(algorithm=6, table number=6, 


key_size=12, multi probe level=2) 

searchParams = dict (checks=100) 

flann = cv2.FlannBasedMatcher (indexParams, searchParams) 
# 使 用 KNN 算法 实现 图 像 匹配 ， 并 对 匹配 结果 排序 

matches = flann.knnMatch (desl, des2, k=2) 

# 清洗 匹配 结果 


matches temp = [] 


for i in matches: 
if len(i) == 
matches_temp .append (i) 
matches = sorted(matches temp, key=lambda x: x[0] .distance) 


不 同 的 图 像 特征 检 测算 法 与 FLANN 算法 结合 使 用 会 产生 不 同 的 匹配 结果 ， 造 成 图 像 


定位 的 坐标 位 置 出 现 差异 ， 但 只 要 这 个 坐标 在 合理 的 范围 内 都 是 允许 的 。 运 行 源码 文件 
ORB + FLANN.py 和 SURF+FLANN py， 结 果 如 图 12-6 所 示 。 


图 12-6 SURF+FLANN ( 左 ) ORB+FLANN ( 右 ) 
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除了 使 用 FLANN 算法 匹配 之 外 ， 还 可 以 使 用 暴力 匹配 与 特征 检测 算法 实现 图 像 的 识 
别 与 定位 。 以 上 述 例 子 为 例 ， 将 其 匹配 算法 改 为 暴力 匹配 ， 具 体 代码 如 下 : 


import cv2 

imgl = cv2.imread('QQ.png') 

img2 = cv2.imread('portrait.png') 

# 使 用 SIFT 算法 获取 图 像 特征 的 关键 点 和 描述 符 

Sift = cv2.xfeatures2d.SIFT create() 

kpl, desl = sift.detectAndCompute (imgl, None) 
kp2, des2 = sift.detectAndCompute (img2, None) 


"wm 实现 过 程 2 """ 

# 定义 暴力 匹配 器 

# BFMatcher 参数 : 

# normType: NORM Ll1, NORM L2, NORM HAMMING, NORM HAMMING2。 
# NORM L1 和 NORM L2 用 于 SIFT 和 SURF 算法 

# NORM HAMMING 和 NORM HAMMING2 用 于 ORB 算法 

bf = cv2.BFMatcher (normType=cv2.NORM Ll1l, crossCheck=True) 
# 使 用 暴力 算法 实现 图 像 匹配 ， 并 对 匹配 结果 排序 

matches = bf.match(desl, des2) 

matches = sorted(matches, key=lambda x: x.distance) 


"mm 实现 过 程 3 """ 

# 获取 某 个 点 的 坐标 位 置 

index = int(len(matches)/2) 

x, y = kpl[matches [index] .queryIdx] .pt 

# 将 坐标 位 置 勾 画 在 oQ.png 图 片 并 显示 图 片 

cv2.rectangle (imgl, (int (x), int(y)), (int(x) + 5, 
dn ol (OF 25057 ON 2 

cv2.imshow('QQ', imgl) 

cv2 .waitKey () 


暴力 匹配 分 别 遍历 两 个 图 像 的 描述 符 ， 确 定 训练 图 像 的 描述 符 是 否 在 目标 图 像 中 找到 
与 之 对 应 的 描述 符 , 它 由 OpenCV 的 BFMatcher() 创 建 匹 配对 象 bf， 再 由 bf 对 象 调用 match() 
方法 实现 图 像 的 匹配 。 

BFMatcher0 有 两 个 参数 设置 ， 分 别 是 normType 和 crossCheck。 人 参数 normType 有 4 个 
参数 值 ， 其 中 NORM L1 和 NORM L2 用 于 SIFT 和 SURF 算法 ，NORM HAMMING 和 
NORM HAMMING2 用 于 ORB 算法 。 参 数 crossCheck 的 参数 值 为 布尔 型 ， 即 True 和 
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False; 当 为 True 时 ， 暴 力 匹 配 就 会 寻找 最 合适 
的 匹配 点 ， 若 为 False， 则 寻找 邻近 的 匹配 点 ; 
一 般 情 况 下 ， 参 数值 默认 使 用 True。 

match0 方 法 实现 图 像 识 别 与 匹配 ， 它 与 
FLANN 的 kmnMatchO 有 着 明显 的 差异 。 当 匹配 
结果 进行 排序 时 ， 可 以 发 现 不 同 的 匹配 方法 设 
置 参数 key 的 表达 式 各 不 相同 ， 而 且 暴 力 匹 配 
的 匹配 结果 无 需 进 行 数 据 清 洗 ， 这 些 差异 都 是 
因为 匹配 结果 的 不 同 而 造成 的 。 想 要 了 解 两 者 
的 差异 ， 可 以 在 PyCharm 上 运行 debug 模式 查 
看 它们 的 数据 格式 。 上 述 代码 的 运行 结果 如 图 
12-7 所 示 。 


图 12-7 图 像 识别 与 定位 


暴力 匹配 还 可 以 与 SURF 算法 或 ORB 算法 结合 使 用 ， 使 用 方式 与 SIFT 算 法 大 同 小 异 。 
以 上 述 的 例子 为 例 ， 将 其 改 为 SURF 算法 或 ORB 算法 ， 本 书 只 列 出 部 分 修改 的 代码 ， 如 果 


需要 完整 的 代码 可 以 在 源码 文件 里 查看 ， 修 改 代 码 如 下 : 


# 源码 文件 SURF+ 暴 力 .py 

# 在 上 述 代 码 中 """ 实现 过 程 1 """ 的 SIFT 改 为 SURF 

# 使 用 SURF 算法 获取 图 像 特征 的 关键 点 和 描述 符 

Surf = cv2.xfeatures2d.SURF create (float (4000)) 
kpl, desl = surf.detectAndCompute (imgl, None) 
kp2, des2 = surf.detectAndCompute (img2, None) 


# 源码 文件 ORB+ 暴 力 .py 

# 在 上 述 代 码 中 """ 实现 过 程 1""" 的 SIFT 改 为 ORB 

# 使 用 ORB 算法 获取 图 像 特 征 的 关键 点 和 描述 符 

orb = cv2.0RB create() 

kpl, desl = orb.detectAndCompute (imgl, None) 

kp2, des2 = orb.detectAndCompute (img2, None) 

# 在 上 述 代码 中 """ 实现 过 程 2 """ 的 定义 匹配 对 象 bf 改 为 

bf = cv2.BFMatcher (normType=cv2.NORM HAMMING, crossCheck=True) 


不 同 的 图 像 特 征 检测 算法 与 同一 匹配 算法 结合 使 用 都 会 产生 不 同 的 匹配 结果 ， 运 行 源 


码 文件 SURF+ 暴 力 .py 和 ORB+ 暴 力 py， 运 行 结 果 如 图 12-8 所 示 。 
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图 12-8 SURF+ 暴 力 〈 左 ) ORB+ 暴 力 ( 右 ) 


12.4 实战 : 自动 打印 PDF 文件 


通过 本 章 的 学 习 ， 我 们 掌握 了 如 何 使 用 OpenCV 来 实现 图 像 识别 与 定位 。 在 自动 化 程 
序 开发 中 ， 图 像 识 别 与 定位 为 自动 化 程序 提供 了 一 双 看 得 见 的 眼睛 ， 正 是 因为 有 了 这 双眼 
睛 ， 程 序 才 能 有 目的 地 执行 相关 的 操作 。 本 章 的 实战 项 目 是 实现 自动 打印 PDF 文件 ， 在 项 
目 中 使 用 OpenCV 实现 图 像 识 别 与 定位 ， 它 为 自动 化 程序 提供 视觉 功能 ， 而 自动 化 操作 仍 
需要 依赖 PyAutoGUI 实现 。 
于 自动 化 程序 是 为 了 解决 计算 机 重复 性 的 操作 ， 因 此 本 项 目 必然 有 多 个 PDF 文件 
而 且 每 个 文件 的 打印 操作 都 是 相同 的 。 我 们 将 所 有 PDF 文件 都 放 在 一 个 名 为 PDF 的 文件 夹 
中 ， 如 图 12-9 所 示 。 


图 12-9 文件 信息 


车 想 要 打印 上 述 PDF 文件 ， 需 要 借助 PDF 阅读 器 来 完成 整个 打印 过 程 。 本 书 以 Adobe 
Reader XI 为 例 ， 在 计算 机 上 运行 Adobe Reader XI 软件 ， 软 件 界面 如 图 12-10 所 示 。 
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最 近 打开 的 文件 ， 查 看 全 部 


而 zpar 


百 sea 


po 
4pdf 

国 我 的 计 相 机 
EB rebateon 


央 通 和 党 任 何 内 容 . 
重用 全 而 的 Mdobe span 罗 动 到 月 证 


关 起 区 主攻 人 攻 寺 


图 12-10 Adobe Reader XI 软件 界面 


在 图 12-10 的 左上 方 单 击 “ 打 开 ” 按 钮 就 会 进入 文件 界面 ， 在 该 界面 上 选择 并 单 击 
“我 的 电脑 ”， 软 件 界面 出 现 一 个 “浏览 ”按钮 ， 单 击 “ 浏 览 ” 按 钮 会 弹出 一 个 新 的 文件 
窗口 。 如 图 12-11 所 示 。 


贺 Adobe Reader 
文件 (站 第 坟 (E 视图 (V】 窗口 (W) 冲动 (H) 
《 返回 


最 近 打 开 的 文件 


机 中 的 文件 


x 
万 
v 加 © 
卉 快速 访问 站 5 a 
i + ipdf 
页 2zpdf 
晤 T 莹 + 而 3.pdf 
国 冻 A# 
从 联机 帐户 中 开 汪 打 0) 有 | 到 涪 


图 12-11 文件 界面 (上 ) 文件 窗口 (下 ) 
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在 文件 窗口 的 文本 输入 框 里 输入 PDF 文件 路 径 并 单 击 “ 打 开 (O)” 按 钮 ， 软 件 就 会 关 
闭 文件 窗口 并 将 文件 内 容 显 示 在 软件 上 。 如 图 12-12 所 示 。 


| 晤 妃 国 全 四 Ba a | [ox [= 二 工具 


Software Developm ent: 
Ruldbor htip:/foulldbor neth . Jlacihtp/hrac edseval eel. Boundup httpdlroundup souces 
System Administration 


Ansible (http- /www. ansible. com) , Salt (http /www.saltstack. coml ， | 


Python Enhancement Proposals (PEPs) (devpeps/): The future of Python is disd 
_R5S (dev/peps/peps.rss) 


图 12-12 PDF 文件 内 容 


Adobe Reader XI 显示 PDF 文件 内 容 后 ， 在 软件 上 找到 “打印 ”图 标 按钮 并 单 击 ， 软 件 
会 弹出 一 个 打印 窗口 。 在 这 个 窗口 中 ， 相 关 的 打印 参数 设置 使 用 默认 值 即 可 ， 然 后 我 们 只 
需 单 击 “ 打 印 ” 按 钮 就 能 完成 文件 打印 。 如 图 12-13 所 示 。 


打印 


ENN: ETT Rt 高 级 0) 
份 数 (C) : | 和 口 以 度 (最后 色 ) 打印 
要 打印 的 页 面 
图 所 有 页 面 (A) 
当前 页 面 (U) 
页 面 (6 『 
”更 多 选项 


调整 页 面 大 小 和 处 理 页 面 @ 
加 0 若海 报 图 多 小 册子 


口 适 合 () 
口 实际 大 小 


图 缩小 过 大 的 页 面 
口 自 定义 比例 : 100 时 


口 按照 PDF 页 面 大 小 选择 纸张 来 源 加 


方向 : 

图 自动 锥 向 /横向 (R) 
〇 其 向 

口 模 向 


图 12-13 打印 窗口 
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如 果 在 打印 窗口 中 的 打印 机 没有 选中 相关 的 打印 机 设备 ， 可 以 在 计算 机 的 控制 面板 一 
设备 和 打印 机 里 面 设置 默认 打印 机 。 如 图 12-14 所 示 。 


是 设备 和 打印 机 
所 ~ 个 纺 控制 面板 ， 所 有 控制 画板 项 设备 和 打印 机 


添加 设备 添加 打印 机 开 冶 扫 柱 查看 现在 正在 打印 什么 打印 最 务 共 属性 


“打印 机 (5) 


sz 三 一 Et 
一 一 
打印 机 属性 (P) XPS Send To 
OneNote 2016 
扫 护 配置 文件 (- 
时 扫 六 属性 (CO 


“设备 (5) 


创建 人 于 方 式 (S) 
罗 到 和 
3d) 


FX22162F 


TXTSXCOTTIT 
i Fuji Xerox Printer 


图 12-14 设置 默认 打印 机 


以 上 是 一 个 PDF 文件 的 打印 操作 过 程 ， 我 们 就 这 个 操作 过 程 来 设计 自动 化 程序 架构 ， 
整个 程序 设计 分 为 4 部分， 设计 说 明 如 下 : 


(1) 通过 程序 启动 并 运行 Adobe Reader XI 软件 ， 用 于 读 取 并 打印 PDF 文件 。 

(2) 获取 PDF 文件 夹 里 PDF 文件 的 路 径 信 息 ， 在 软件 中 输入 文件 路 径 即 可 读 取 相 应 
的 文件 内 容 。 

(3) 利用 OpenCV 实现 图 像 识 别 与 定位 ， 计 算出 训练 图 像 在 计算 机 屏幕 上 的 坐标 
位 置 。 

(4) 根据 图 像 的 坐标 位 置 ， 使 用 PyAutoGUI 模块 实现 自动 化 操作 。 


根据 上 述 程序 设计 说 明 来 实现 相应 的 功能 代码 ， 整 个 程序 代码 如 下 所 示 : 


import subprocess 

import cv2 

import pyautogui 

import time 

import os 

获取 文件 夹 的 所 有 PDF 文件 路 径 


def file name (file _ dir) : 
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temp = [] 
for root, dirs, files in os.walk(file dir): 
for file in files: 
if os.path.splitext (file) [1] == '.pdf': 
temp.append (os.path.join(root, file)) 
return temp 


## 图 像 识 别 与 定位 
def get position(local): 
# 将 当前 屏幕 截图 ， 作 为 目标 图 像 
pyautogui .screenshot ('computer .png') 
imgl = cv2.imread('computer.png') 
img2 = cv2.imread (local) 
# 获取 图 像 特 征 的 关键 点 和 描述 符 
sift = CV2 .xfeatures2d.SIFT_create () 
kpl, desl = sift.detectAndCompute (imgl, None) 
kp2, des2 = sift.detectAndCompute (img2, None) 
# 定义 暴力 匹配 器 
bf = cv2.BFMatcher (normType=cv2.NORM L1，crossCheck=True) 
# 使 用 暴力 算法 实现 图 像 匹 配 ， 并 对 匹配 结果 排序 
matches = bf.match (desl, des2) 
matches = sorted(matches, key=lambda x: x.distance) 
# 获取 某 个 点 的 坐标 位 置 


index = int(len(matches) / 2) 


x, y = kpl [matches [index] .queryIdx] .pt 
return (x, y) 


3 name == "' main ': 
# 运行 Adobe Reader 软件 
sf = r"C:\Program Files (x86)\Rdobe\Reader\Reader\RcroRd32 .exe" 
subprocess.Popen (sf) 


time.sleep (3) 


# 获取 文件 夹 里 面 所 有 的 PDF 文件 
file path = r"C:\Users\000\Desktop\pdf" 
file list = file name(file path) 


kor ff Tn file lists 
# 单 击 “ 打 开 ” 图 标 


position = get position('open.png') 


pyautogui.click (x=position[0], y=position[1], interval=1) 
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# 单 击 “ 我 的 电脑 ”图 标 

position = get position('myPC.png') 

pyautogui.click (x=position[0], y=position[1], interval=1) 
# 单 击 “ 浏 览 ” 图 标 

position = get position('browse.png') 

pyautogui.click (x=position[0], y=position[1], interval=1) 
# 输入 PDF 文件 路 径 

pyautogui .typewrite (f) 

# 单 击 “ 打 开 ” 按 钮 

position = get position('openFile.png') 

pyautogui.click (x=position[0], y=position[1], interval=1) 
# 单 击 “ 打 印 ” 图 标 ， 进 入 打印 预览 

position = get position('openPrint.png') 
pyautogui.click(x=position[0], y=position[1], interval=1) 
# 单 击 “ 打 印 ” 按 钮 

position = get position('print.png') 
pyautogui.click(x=position[0], y=position[1], interval=1) 
# 快捷 键 关 闭 当 前 PDF 文档 

time.sleep (5) 

pyautogui.hotkey('ctrl', ‘'w') 


述 代码 的 主 程序 中 ，Adobe Reader XI 软件 的 运行 由 Python 内 置 的 subprocess 模块 实 
模块 通过 程序 执行 计算 机 系统 命令 ， 代 码 中 的 Popen() 方 法 表示 使 用 系统 命令 来 创建 
来 启动 并 运行 Adobe Reader XI 软件 。 

件 夹 中 的 所 有 PDF 文件 路 径 信息 通过 调用 函数 fle name 来 获取 ， 参 数 file_dir 代表 
的 路 径 地 址 ， 整 个 函数 实现 的 功能 都 由 Python 内 置 os 模块 完成 。 


PDF 文件 的 路 径 信息 获取 后 ， 程 序 对 其 进行 遍历 处 理 ， 每 次 遍历 就 是 对 当前 的 文件 进 
行 打印 操作 。 每 个 打印 操作 步骤 都 调用 函数 get_position 来 获取 坐标 位 置 ， 然 后 使 用 


PyAuto 
函 
要 被 定 
它 是 日 


找 出 训 


GUI 模块 在 这 个 坐标 位 置 上 执行 相应 的 鼠标 操作 。 

数 get_position 使 用 SIFT 算法 和 暴力 匹配 来 实现 图 像 识别 与 定位 。 参 数 local 代表 需 
位 的 图 像 ， 也 就 是 OpenCV 里 面 的 训练 图 像 ， 目 标 图 像 是 整个 计算 机 的 当前 屏幕 ， 
PyAutoGUI 的 screenshot() 方 法 来 截取 计算 机 全 屏 。 通 过 图 像 之 间 的 特征 匹配 ， 可 以 
练 图 像 在 目标 图 像 里 面 所 在 的 位 置 ， 这 个 位 置 需要 PyAutoGUI 操作 的 坐标 位 置 。 


母 


次 调用 函数 get_position 都 要 传 入 一 张 训练 图 像 ， 训 练 图 像 是 软件 中 某 个 按钮 的 截 
了 验证 OpenCV 图 像 识别 的 稳定 性 ， 我 们 可 将 训练 图 像 进行 简单 的 旋转 处 理 ， 如 图 


12-15 所 示 。 
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openFile.png openPrintpng printpng 


图 12-15 训练 图 像 文件 


12.5 ”本 章 小 结 


数 


汪 


使 


特征 检测 是 计算 机 对 一 张 图 像 中 最 为 明显 的 特征 进行 识别 检测 并 将 其 勾画 出 来 。 大 多 
特征 检测 都 会 涉及 图 像 的 角 点 、 边 和 斑点 识别 或 者 对 称 轴 。 图 像 特征 检测 算法 主要 有 角 
检测 、SIFT 检测 、SURF 检测 和 ORB 检测 。 其 中 SIFT 检测 、SUREF 检测 和 ORB 检测 的 
用 方法 如 下 : 


import cv2 

# 读 取 图 片 

img = cv2.imread('logo.png') 

# SIFT 检测 

# 定义 SIET 对 象 

sift = CV2 .xfeatures2d.SIFT_create () 

# 检测 关键 点 并 计算 描述 符 

# 描述 符 是 对 关键 点 的 描述 ， 可 用 于 图 片 匹配 

keypoints, descriptor = sift.detectAndCompute (img, None) 


# SURF 检测 

# 定义 SURF 对 象 ， 参 数 float (1000) 为 阔 值 ， 阔 值 越 高 ， 识 别 的 特征 越 小 。 
Surf = cv2.xfeatures2d.SURF create (float (1000) ) 

# 检测 关键 点 并 计算 描述 符 

描述 符 是 对 关键 点 的 描述 ， 可 用 于 图 片 匹 配 


keypoints, descriptor = surf.detectAndCompute (img，None) 


# ORB 检测 
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力 匹 配 和 FLANN 匹配 ， 而 图 像 定 位 则 是 通过 图 像 匹配 结果 来 反 向 查询 它们 在 目标 图 片 中 
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# 定义 ORB 对 象 

orb = Cyv2-ORB createl() 

# 检测 关键 点 并 计算 描述 符 

# 描述 符 是 对 关键 点 的 描述 ， 可 用 于 图 片 匹配 


keypoints, descriptor = orb.detectAndCompute (img, None) 


图 像 匹 配 与 定位 是 由 图 像 特 征 的 keypoints 和 descriptor 实 现 的 。 图 像 匹配 算法 主要 有 暴 


的 具体 坐标 位 置 。 暴 力 匹 配 和 FLANN 匹配 的 使 用 方法 如 下 : 


定义 暴力 匹配 器 

# BFMatcher 参数 : 

# normType: NORM L1, NORM L2, NORM HAMMING, NORM HAMMING2。 
# NORM L1 和 NORM L2 用 于 SIFT 和 SURF 算法 

# NORM HAMMING 和 NORM HAMMING2 用 于 ORB 算法 

bf = cv2.BFMatcher (normType=cv2.NORM Ll1l, crossCheck=True) 
# 使 用 暴力 算法 实现 图 像 匹配 ， 并 对 匹配 结果 排序 

matches = bf.match(desl, des2) 

matches = sorted(matches, key=lambda x: x.distance) 

# 获取 某 个 点 的 坐标 位 置 


index = int(len(matches)/2) 


x, y = kpl[matches [index] .queryIdx] .pt 
# 定义 FLANN 匹配 器 


indexParams = dict(algorithm=0，trees=10) 


searchParams = dict(checks=50) 

flann = cv2.FlannBasedMatcher (indexParams, searchParams) 
# 使 用 KNN 算法 实现 图 像 匹配 ， 并 对 匹配 结果 排序 

matches = flann.knnMatch (desl, des2, k=2) 

matches = sorted(matches, key=lambda x: X[0].distance) 
# 去 除 错误 匹配 ，0.5 是 系数 ， 系 数 大 小 不 同 ， 匹 配 的 结果 也 不 同 
goodMatches = [] 


for m, n in matches: 
if m.distance < 0.5 * n.distance: 
goodMatches .append (m) 
# 获取 某 个 点 的 坐标 位 置 
# index 是 获取 匹配 结果 的 中 位 数 
index = int(len(goodMatches)/2) 
# queryIdx 是 目标 图 像 的 描述 符 索引 
x, Y = kpl[goodMatches [index] .queryIdx] .pt 


App 自动 化 开发 


本 章 讲述 如 何在 Python 中 使 用 Appium 实现 手机 App 自动 化 开发 ， 主 要 内 容 包 括 
Appium 简介 、 搭 建 开 发 环境 、Appium 连接 手机 并 实现 手机 元 素 的 定义 与 操控 ， 如 点 击 屏 
幕 、 滑 动 屏 幕 和 文本 输入 等 操作 。 


13.1 Appium 简介 及 原理 


Appium 是 一 个 开源 、 跨 平台 的 测试 框架 ， 可 以 用 来 测试 原生 及 混合 的 移动 端 应 用 。 
Appium 支持 iOS、Android 及 FirefoxOS 平台 。 它 使 用 WebDriver 的 JSON Wire 协议 来 驱动 
iOS 系统 的 UIAutomation 库 以 及 Android 系统 的 UIAutomator 框架 。 它 允许 自动 化 人 员 在 不 
同 的 平台 (iOS，Android) 使 用 同一 套 API 来 写 自 动 化 脚本 ， 这 样 大 大 增加 了 iOS 和 Android 
的 代码 复 用 性 。 

整个 Appium 分 为 Client 和 Server: Client 封装 了 Selenium 客户 端 类 库 ， 为 用 户 提供 所 
有 常见 的 Selenium 命令 以 及 额外 的 移动 设备 控制 相关 的 命令 ， 如 多 点 触 控 手势 和 屏幕 朝向 
等 ，Server 定义 了 官方 协议 的 扩展 ， 为 用 户 提供 了 方便 的 接口 来 执行 各 种 设备 动作 ， 例 如 
在 测试 过 程 中 安装 /卸载 App 等 。 

Appium 支持 多 种 编程 语言 开发 自动 化 程序 ， 这 取决 于 它 选 择 了 Client/Server 的 设计 模 
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式 。Client 通过 发 送 HTTP 请 求 给 Server， 当 Server 接收 Client 发 送 的 请 求 时 ， 会 解析 请 求 
内 容 并 调用 对 应 的 系统 框架 ， 在 移动 设备 上 执行 自动 化 操作 。 因 为 Client 和 Server 之 间 采 
用 HTTP 协议 ， 所 以 Client 用 什么 语言 来 开发 自动 化 程序 都 是 可 以 的 。Appium 的 工作 原理 
如 图 13-1 所 示 。 


Appium-client Appium-Server 移动 设备 


appium.dmg 


[Pamt | | | varia 机 
Window.zi 
La | Losamm_ | 


Android 模拟 器 


图 13-1 Appium 的 工作 原理 
从 Appium 的 原理 图 可 以 看 到 ，Appium-Client 能 为 我 们 提供 自动 化 功能 模块 ， 用 于 编 


写 自 动 化 程序 。 在 Python 中 ， 它 是 第 三 方 模块 Appium， 该 模块 是 在 Selenium 库 的 基础 上 
进行 封装 。Appium-Server 是 基于 Node.JS 开发 的 服务 端 ， 主 要 接收 Appium-Client 的 请 求 ， 
然后 根据 请 求 信息 操作 移动 设备 ， 从 而 实现 自动 化 操作 。 


13.2 ”搭建 开发 环境 


Appium 支持 Android 和 iOS 系统 的 移动 设备 自动 化 开发 ， 但 是 苹果 设备 的 自动 化 程序 
必须 在 Mac 下 进行 开发 ，Windows 和 Linux 平台 是 无 法 进行 的 ， 因 此 我 们 以 Android 系统 
为 例 。 

在 Windows 系统 上 搭建 Appium 开发 环境 ， 需 要 安装 Java JDK、Android SDK、 
Node.JS、Appium-Server 和 Appium-Client， 具 体 安装 说 明 如 下 。 


@ Java JDK: 搭建 Java 开 发 环境 。 

。 Android SDK: Android 软 件 开发 包 ， 基 于 Java 的 开发 环境 运行 ， 可 以 在 计算 机 启用 
Android 模 拟 器 或 者 连接 Android 手 机 。 

@ Node.JS: 搭建 Node.JS 的 开发 环境 。 

@ Appium-Server: 安装 Appium 的 服务 器 ， 基 于 Node.JS 的 开发 环境 运行 。 

。 Appium-Client: 安装 Appium 的 客户 端 ， 编写 并 运行 Appium 自 动 化 代码 。 


Java JDK 是 在 Windows 上 搭建 Java 的 开发 环境 ， 因 
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为 Android SDK 是 基于 Java 的 开 


发 环境 运行 的 。 目 前 Java 已 有 新 版 本 是 10.0， 但 Android SDK 仅 支持 Java 8 版 本 ， 因 此 我 
们 需要 安装 Java 8 版 本 ， 在 浏览 器 中 访问 http://www.oracle.com/technetwork/java/javase/ 
downloads/jdk8-downloads-2133151 .html， 下 载 与 计算 机 系统 匹配 的 安装 包 ， 如 图 13-2 所 示 。 


园 Java SE pevebpmenty x 


8 


GC |@ fe | wwworaclecom/technatwor/java/javass/downloads/jdk8-downloads-2133151.html 


Java SE Development Kit 8u181 
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; Da 
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Linux ARM 32 Hard Fioat ABI 
Linux ARM 64 Hard Fioat ABI 


ac OS Xx 
Solris SPARC 64-bit (SVR4 package) 
Solans SPARC 64-bft 

Solris x04 (SVR4 package) 

Solris x64 

Windows x36 


图 13-2 Java 版 本 下 载 


安装 包 下 载 后 直接 双击 运行 并 根据 安装 提示 即 可 完成 安装 ， 安 装 路 径 使 用 默认 设置 即 
可 。 安 装 成 功 后 ， 还 需要 设置 计算 机 的 系统 环境 变量 。 右 键 单 击 我 的 电脑 一 选择 属性 一 选 
择 系统 保护 一 选择 高 级 一 单 击 环境 变量 一 单 击 系统 变量 的 新 建 按钮 ， 分 别 输入 变量 名 
JAVA_HOME 和 变量 值 C:\Program Files\Java\jdk1.8.0_181， 变 量 值 是 Java 的 默认 安装 路 


径 ， 有 具体 操作 如 


图 13-2 所 示 。 
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图 13-3 设置 Java 环境 变量 
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Java 环境 变量 设置 成 功 后 ， 打 开 CMD 窗口 来 验证 Java 是 否 安装 成 功 。 在 CMD 窗口 输 
入 java -version 并 按 回 车 就 会 显示 当前 Java 的 版 本 信息 ， 如 图 13-4 所 示 。 


CA\Windows\system32\cmd.exe 


er 


图 13-4 ”Java 版 本 信息 

Java 的 开发 环境 搭建 后 ， 下 一 步 是 搭建 Android SDK。Android SDK 提供 了 Android 
API 库 和 开发 工具 构建 、 测 试 和 调试 应 用 程序 。 简 单 来 讲 ，Android SDK 可 以 用 于 开发 和 
运行 Android 系统 的 应 用 软件 。 在 官网 上 没有 提供 单独 的 Android SDK 下 载 链接 ， 官 方 推 荐 下 
载 包 含 Android SDK 的 Android Studio 。 只 能 通过 其 他 路 径 下 载 ， 在 浏览 器 访问 
http://tools.android-studio.org/index.php/sdk， 单 击 下 载 android-sdk r24.4.1-windows.zip， 如 图 
13-5 所 示 。 

ools ndrold studo org 


Android Studio 


ANDROID | Toots 


图 13-5 下 载 Android SDK 


将 android-sdk r24.4.1-windows.zip 进行 解压 并 放置 在 DD 盘 的 SDK 文件 夹 里 ， 放 置 的 路 
径 没有 具体 要 求 ， 只 要 存在 的 空间 足够 大 即 可 ， 因 为 后 续 更 新 Android SDK 会 占用 比较 大 
的 存储 空间 。Android SDK 的 路 径 信 息 如 图 13-6 所 示 。 
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此 电脑 ， 软件 (Dj ， SDK ， android-sdk-windows 


名 称 
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platforms 


轩 tools 

国 AvD Managerexe 
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国 sDK Readmetbt 


修改 日 期 


图 13-6 Android SDK 的 文件 信息 


根据 图 上 的 文件 路 径 信息 ， 


将 其 添加 到 计算 机 的 系统 环境 变量 中 ， 添 加 方式 与 Java 的 


相似 。 新 增 变量 ANDROID HOME， 变量 值 是 Android SDK 的 文件 路 径 ， 如 图 13-7 所 示 。 


在 系统 变量 Path 添加 两 个 变量 值 ， 分 别 是 Android SDK 的 platform-tools 逢 


文件 路 径 ， 如 图 13-8 所 示 。 


[ANDROID_HOME 


tools 文件 夹 的 


DA\SDK\android-sdk-windows| 


浏览 文件 (了 ~ 


图 13-7 添加 变量 ANDROID_HOME 
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图 13-8 ”变量 Path 添加 变量 值 
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双击 运行 SDK Manager.exe， 这 是 更 新 安装 SDK 的 版 本 信息 。 根 据 实际 需求 选择 安装 
Android 版 本 ， 比 如 本 书 的 Android 手机 系统 版 本 是 Android 8.0，Android 模拟 器 是 5.0 版 
本 ， 安 装 选项 如 图 13-9 所 示 。 
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图 13-9 Android SDK 安装 选项 


完成 Android SDK 的 更 新 后 ， 打 开 AVD Manager.exe 来 创建 Android 模拟 器 。Android 
模拟 器 是 能 在 电脑 上 模拟 Android 操作 系统 ， 可 以 安装 、 使 用 、 逢 载 Android 应 用 的 软件 ， 
它 能 让 你 在 电脑 上 也 能 体验 操作 Android 系统 的 全 过 程 。 

在 AVD Manager 界面 上 单 击 “Create” 按 钮 就 会 出 现 Android 模拟 器 的 配置 信息 ， 填 
写 配 置信 息 后 单 击 “OK” 按 钮 就 能 创建 Android 模拟 器 ， 如 图 13-10 所 示 。 


+ 


Android 


Nexus 5 (4.95", 1080 x 1920: xxhdpi) 
Android 5.0.1 - API Level 21 


ARM (armeabi-v7a) 


回 Hardware keyboard present Repair... 


页 nr Device that fa 


图 13-10 创建 Android 模拟 器 
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Android 模拟 器 创建 后 ， 在 AVD Manager 界面 可 以 看 到 刚 创 建 的 模拟 器 信息 ， 使 用 鼠 
标 选中 模拟 器 信息 并 单 击 “Start” 按 钮 一 单 击 “Launch” 按 钮 即 可 运行 Android 模拟 
器 ，Android 模拟 器 开启 时 间 相 对 较 长 ， 需 要 耐心 等 待 。 如 图 13-11 所 示 。 


百 Android Emulator - Android5.0.1 


768x1280 
Android Virtual Devices Device Definitions sigr 320 
isting Android Virtual Devices located at C\Users\000\android\avd 


Platf.. API .. CPU/AB! 


加 Android.，Android 5.0.1 501 21 ARM (armeabi-v7al| 


Wipe user data 
Delete 


Details. 


A A repairable Android Virtual Device. XK An Android Virtual Device that failed to load Click ‘De 


图 13-11 启动 Android 模拟 器 


最 后 测试 Android SDK 与 手机 的 连接 是 否 成 功 ， 手 机 通过 USB 连接 电脑 ， 并 且 开 启 手 
机 的 开发 者 模式 以 及 安装 相应 的 驱动 程序 。 不 同 手机 的 开发 者 模式 的 开启 方法 各 不 相同 ， 
本 书 就 不 详细 讲述 了 ， 具 体 的 开启 方法 可 自行 上 网 查询 ， 手 机 的 驱动 程序 安装 成 功 后 可 以 
在 设备 管理 器 查看 。 完 成 上 述 操作 后 ， 在 CMD 窗口 输入 指令 adb devices 查看 手机 信息 。 
如 果 没 有 开启 开发 者 模式 及 安装 驱动 程序 ， 在 CMD 窗口 是 无 法 显示 手机 信息 的 。 如 图 
13-12 所 示 。 

吉 设备 管理 器 


文件 (F) ”操作 (A) ”查看 (V) ”帮助 (H) 
和 中 | 加 | 国 | 回 园 | 男 | 有 RX@ 


画 C\Windows\system32\cmd.exe 


党 Network Infrastructure Devices 
部 WSD 打印 提供 程序 
妓 安全 设备 


图 13-12 ”驱动 程序 ( 左 ) 手机 信息 〈 右 ) 


下 一 步 是 搭建 Node.JS 的 开发 环境 ， 该 开发 环境 用 来 运行 Appium-Server。 在 官方 网 站 
载 Node.JS 8.12 版 本 ， 在 浏览 器 中 访问 https://nodejs.org/en/download/， 根 据 自 己 的 计算 
机 系统 下 载 相应 的 安装 包 ， 如 图 13-13 所 示 。 
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@ ownlosd| Nodeje 


Current 


Latest Features 


% 高 


Windows Installer macOs Installer Source Code 


Windows Installer (.msi) 2 
Windows Binary (.zip) 32-b ;4bit 

macOs Installer (.pkg) 

macOs Binary (tar.gz) 

Linux Binaries (x86/x64) 


Linux Binaries (ARM) 


图 13-13 Node.JS 安装 包 


Node.JS 安装 包 是 一 个 Windows 可 执行 的 应 用 程序 ， 直 接 双 击 运行 并 根据 安装 提示 进 
行 安装 ， 安 装 路 径 等 一 些 安装 提示 使 用 默认 设置 即 可 。 安 装 成 功 后 ， 在 CMD 窗口 验证 
Node.JS 是 否 安装 成 功 ， 验 证 指令 以 及 验证 结果 如 图 13-14 所 示 。 

Appium-Server 分 为 Server 版 和 Desktop 版 ， 丽 Cndow yom nem ene 
Server 版 在 2015 年 底 已 经 停止 更 新 , 被 Desktop i 
版 而 取而代之 , 本 书 以 Desktop 版 为 例 ， 在 github 

( https://github.com/appium/appium-desktop/releases/ 
tag/1.7.0) 下 载 exe 安装 包 ， 选 取 1.7 最 新 版 本 ， 


如 图 13-15 所 示 。 图 13-14 验证 NodeJS 
日 可 x 
© Release 170.appium x 
CC | @ GitHub, Inc [US] | https://github.com, k 女 


国 appium-desktop-17.0-maczip 
国 appium-desktop-17.0-x86_.64.Applmage 5 MB 


国 appium-desktop-Setup-17.0-ia32.exe 7OMB 


国 appium-desktop-setup-17.0.exe 
国 appium-desktop-setup-17.0.exe blockmap Ti9kB 


appium-desktop-web-setup-1.7.0.exe 


国 Iatestlinuxyml 


图 13-15 Appium-Server 安装 包 


Appium-Desktop 下 载 后 直接 运行 ， 安 装 路 径 等 一 些 安装 提示 使 用 默认 设置 即 可 。 安 装 
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成 功 后 在 桌面 上 看 到 Appium 图 标 ， 双 击 图 标 后 ， 在 Appium-Desktop 的 界面 上 单 击 “Start 
Server v1.9.0” 按 钮 来 启动 Appium-Server， 如 图 13-16 所 示 。 


ium v1.9.0 


http interface listener started on 0.0.0. 


图 13-16 启动 Appium-Server 


最 后 安装 Appium-Client 的 Python 版 本 ,在 CMD 窗口 下 输入 pip install 
Appium-Python-Client 指令 并 等 待 安装 完成 即 可 。 

在 搭建 Appium 的 过 程 中 ， 我 们 分 别 安装 了 Java JDK、Android SDK、Node.JS、 
Appium-Server 和 Appium-Client， 每 个 开发 环境 之 间 都 有 一 定 的 联系 ， 比 如 Java JDK 和 
Android SDK 的 兼容 性 问题 等 。 


13.3 连接 Android 系统 


Appium 对 Android 系统 实现 自动 化 操作 ， 第 一 步 是 将 Appium 与 Android 进行 通信 
接 ， 连 接 代码 相对 比较 固定 。 在 连接 代码 中 根据 Android 系统 信息 进行 相应 的 修改 即 可 实 
现 连 接 。 连 接 代码 如 下 : 

from appium import webdriver 

desired caps = {} 

# 设置 android 系统 信息 

desired caps['platformName'] = "'Android' 


desired caps['platformVersion'] = '8.0" 

desired caps['deviceName'] = 'huawei-11d al20-30KNW18730002140"' 
desired caps['appPackage'] = 'com.android.calculator2' 

desired caps['appActivity'] = '.Calculator' 


# 向 Appium-Server 发 送 请 求实 现 连 接 
driver = webdriver.Remote('http://localhost:4723/wd/hub', desired caps) 


在 上 述 代 码 中 ， 变 量 desired_caps 是 一 个 字典 ， 字 典 的 key 是 代表 Appium 与 Android 
系统 的 连接 参数 ， 字 典 的 value 是 Android 系统 信息 。 每 个 key 代表 不 同 的 意思 ， 具 体 说 明 
如 下 。 
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platformName: 需要 被 连接 的 操作 系统 ， 如 iOS、Android 或 FirefoxOS 。 
PlatformVersion: Android 系 统 的 当前 版 本 信息 ， 如 本 书 的 手机 系统 为 8.0。 
deviceName: 每 台 移 动 设备 或 模拟 器 的 设备 名 ， 设 备 名 是 唯一 的 。 
appPackage: 需要 执行 自动 化 的 Android 应 用 的 包 名 。 

appActivity: Android 应 用 包 中 启动 的 Android Activity 名 称 。 


这 5 个 参数 是 连接 Android 系 统 的 基本 参数 ， 每 个 参数 值 的 获取 方式 各 不 相同 。 下 面 我 
们 讲述 参数 值 的 获取 方法 。 

参数 platformName 只 有 三 个 参数 值 ， 分 别 是 iOS、 
Android 和 FirefoxOS， 代 表 不 同 的 操作 系统 。 

参数 platformVersion 是 移动 设备 或 模拟 器 的 系统 版 本 
信息 。 以 华为 手机 的 系统 版 本 信息 获取 为 例 ， 可 在 手机 的 
“设置 ”一 “系统 ”一 “关于 手机 ”里 面 找 到 Android 版 
本 信息 ， 如 图 13-17 所 示 。 图 13-17 Android 版 本 信息 

参数 deviceName 的 参数 值 获取 较为 繁琐 ， 获 取 过 程 需要 借助 工具 来 完成 。 打 
Android SDK 所 在 的 文件 夹 ， 找 到 tools 文件 夹 里 的 wiautomatorviewer.bat 文件 并 双击 运行 ， 
该 文件 启动 一 个 名 为 UI Automator Viewer 的 软件 ， 该 软件 用 于 捕捉 Android 应 用 程序 的 控 
件 元 素 信息 ， 在 下 一 节 中 需要 借助 该 软件 来 实现 元 素 的 定位 。 软 件 界面 如 图 13-18 所 示 。 

| UI Automator Viewer 


S| 国 


型 号 LLD-AL20 


版 本 与 LLD-AL20 8.0.0.123(C00) 


EMUI 版 本 80.0 


Android 版 本 


获取 安 卓 系统 当前 界面 的 控件 信息 


图 13-18 软件 界面 
在 Android SDK 的 文件 路 径 中 找到 AVD Manager.exe 并 双击 运行 ， 该 exe 程序 可 以 启 
确 
击 


动 Android 模拟 器 ， 有 具体 的 启动 方式 如 图 13-11 所 示 。 再 将 手机 连接 到 计算 机 ， 连 接 之 前 
保 手 机 已 开启 USB 调试 模式 ， 连 接 成 功 后 ， 手 机 界面 会 出 现 一 个 USB 调试 提示 信息 ， 单 
“确定 ”按钮 即 可 ， 如 图 13-19 所 示 。 

现在 计算 机 已 分 别 开 启 了 Android 模拟 器 和 连接 了 一 台 Android 手机 ， 单 击 图 13-18 所 
标注 的 按钮 ， 软 件 就 会 出 现 一 个 设备 选择 的 界面 ， 界 面 中 的 设备 名 就 是 参数 deviceName 的 
参数 值 。 总 的 来 说 ， 参 数 deviceName 的 获取 必须 借助 工具 UI Automator Viewer， 同 时 保证 
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计算 机 已 连接 两 台 或 以 上 的 Android 设备 或 Android 模拟 器 ， 如 图 13-20 所 示 。 


h 


是 否 允 许 USB 调试 ? 


这 台 计 算 机 的 RSA 密 钥 指纹 如 下 : 
CC:9E:7D:F2:5D: 
45:DA:F5'C4:96:EF:DF:C9:1A:F7:F0 


始终 允许 使 用 这 全 计算 机 进行 调试 


Select device| |huawei-lld_al20-37KNW18730002140 ~ 


aw 20-37KNW1873000214 


Android5.0.1 [emulator-5554] 


U 


取消 
参数 deviceName 的 参数 值 


图 13-19 USB 调试 提示 信息 图 13-20 ”获取 deviceName 


参数 appPackage 同样 需要 借助 工具 UI Automator Viewer 获取 ， 选 中 图 13-20 中 的 
uawei 设备 并 且 确 保 手 机 的 屏幕 常 亮 ， 单 击 “OK” 按 钮 ， 软 件 就 会 自动 捕捉 手机 当前 界 


i 的 控件 信息 。 单 击 手 机 上 的 某 个 控件 ， 该 控件 信息 就 会 显示 在 右 侧 。 其 中 参数 package 


的 参数 值 就 是 参数 appPackage 的 参数 值 ， 如 图 13-21 所 示 。 


参数 appActivity 的 获取 需要 保证 计算 机 上 只 有 一 台 Android 设备 或 Android 模 拟 器 。 以 


手机 为 例 ， 关 闭 Android 虚拟 机 ， 打 开 CMD 窗口 并 输入 adb shell dumpsys activity activities 


指令 来 获取 当前 设备 的 程序 运行 信息 。 在 这 些 信息 中 可 以 找 出 appActivity 的 参数 值 ， 比 如 
查找 微 信 的 appActivity， 通 过 参数 appPackage 确定 appActivity 的 参数 值 ， 如 realActivity= 
comtencentmmy/uiLauncherUI， 斜 杠 后 面 的 内 容 .ui.LauncherUI 就 是 参数 appActivity 的 参数 
值 ， 如 图 13-22 所 示 。 


而 Ul Automator Viewer 


驴 眉 个 日 


: “| | > 


~ (0) LinearLayout [42.294][1038,438] ~ 
Y (0) LinearLayout [42,294][1038,438] 
~ (0) LinearLayout [42,294][1038,438] 


(0) comitencent mm.ui MMImag 


inearl av MAR 2q71a1R4 Y 
> 


Node Detail 

index 0 A 
text 朋友 加 

resource-id android:id/title 

class android.widget.TextView 


content-desc 


图 13-21 控件 信息 
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接 移动 设备 或 模拟 器 上 还 提供 了 


13-1 所 示 。 


图 13-22 查找 appActivity 


参数 appPackage 和 参数 appActivity 的 获取 方法 并 不 是 唯一 的 ， 这 两 个 参数 都 可 以 通过 
不 同 的 方法 获取 ， 有 兴趣 的 读者 可 以 自行 在 网 上 查阅 相关 的 资料 。 除 此 之 外 ，Appium 在 连 


很 多 连接 参数 ， 本 书 列 出 


- 些 常用 的 参数 及 其 说 明 ， 如 表 


表 13-1 Appium 连接 移动 设备 或 模拟 器 的 常用 参数 
参数 说 明 参数 值 
通用 参数 
automationName 选择 自动 化 引擎 了 ds 
UiAutomator 2、Espresso 
App 在 移动 设备 上 安装 应 用 程序 安装 包 存 放 路 径 ， 如 D:\QQ.apk 
browserName 移动 网 页 浏览 器 的 名 称 a 
“Chrome” 
客户 端 退出 并 结束 连接 之 前 ， a 
newCommandTimeout Appium 等 待 客户 端 新 命令 的 时 间 时 间 以 秒 为 单位 
Language 设置 语言 如 中 国 一 一 CN 
Locale 设置 语言 环境 如 中 文 一 一 zh_CN 
Udid 连接 物理 设备 的 唯一 设备 标识 符 ”| 如 手机 的 序列 号 
noReset 连接 之 前 不 重 置 应 用 程序 状态 布尔 型 ， 默 认为 True 
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( 续 表 ) 
参数 说 明 参数 值 
通用 参数 
行 完整 的 重 置 ， 即 清除 应 
fullReset pi E 置 ， 即 清除 应 用 数据 布尔 型 ， 默 认为 False 
启用 或 禁用 Appi 部 事 

eventTimings eo a 人 默认 为 False 
El 启用 Chromedriver (在 Android 上 ) 默认 False 


或 Safari (在 IOS 上 ) 性 能 记录 
仅 限 Android 


appWaitActivity 等 待 Android 应 用 程序 启动 等 同 appActivity 参数 值 
app WaitPackage 等 待 Android 应 用 程序 的 程序 包 等 同 appPackage 参数 值 
app WaitDuration 设置 appWaitActivity 启动 的 超时 以 毫秒 为 单位 ， 默 认 值 为 20000 
deviceReadyTimeout 设置 设备 准备 状态 的 超时 以 秒 为 单位 
androidInstallTimeout 等 待 apk 安装 到 设备 的 超时 以 毫秒 为 单位 ， 默 认为 90000 
androidInstallPath 设置 apk 的 安装 路 径 默认 路 径 : /data/local/tmp 
adbPort 用 于 连接 到 ADB 服务 器 的 端口 默认 5037 

. 允许 ChromeDriver 传递 chromeOptions: {args: 
chromeOptions 


chromeOptions 功能 
在 移 至 非 ChromeDriver 网 页 浏览 


[--disable-popup-blocking']} 


recreateChromeDriverSessions 的 情况 下 杀 死 ChromeDriver 会 话 默认 为 False 
设置 网 络 速度 模拟 ， 指 定 最 大 的 网 

networkSpeed 络 上 传 和 下 载 速度 默认 为 full 

androidScreenshotPath 设置 设备 上 的 屏幕 截图 的 路 径 地 址 ”| 默认 路 径 : /data/local/tmp 

resetKeyboard 使 用 unicode 编码 方式 发 送 字符 串 | 布尔 型 ， 默 认 值 False 

unicodeKeyboard 将 键盘 隐藏 起 来 布尔 型 ， 默 认 值 False 

仅 限 iOS 
calendarFormat 设置 日 历 格式 例如 gregorian 
Udid 连接 物理 设备 的 唯一 设备 标识 符 如 手机 的 序列 号 


locationServicesEnabled 


强制 定位 服务 处 于 打开 或 关闭 状态 


布尔 型 ， 默 认 保 持 当前 的 模拟 设置 


locationServicesAuthorized 


将 位 置 服务 设置 为 授权 或 未 授权 


布尔 型 ， 默 认 保持 当前 的 模拟 设置 


safariInitialUrl 初始 Safari 浏览 器 网 址 默认 为 本 地 欢迎 页 面 

safariAllowPopups 允许 JS 在 Safari 中 打开 新 窗口 布尔 型 ， 默认 保持 当前 的 模拟 设置 
safarilgnoreFraudWarning 防止 Safari 显示 欺诈 网 站 警告 布尔 型 ， 默 认 保持 当前 的 模拟 设置 
safariOpenLinksInBackground | Safari 是 否 允 许 在 新 窗口 中 打开 链接 | 布尔 型 ， 默认 保持 当前 的 模拟 设置 


appName 


应 用 程序 的 显示 名 称 


例如 UICatalog 
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13.4” 定 位 元 素 


上 一 节 讲 述 了 Appium 连接 Android 系统 的 实现 过 程 ， 程 序 中 以 driver 对 象 表示 连接 成 
功 并 且 将 连接 状态 持久 化 ， 整 个 自动 化 程序 都 是 围绕 这 个 driver 对 象 进行 展开 。Appium 为 
driver 对 象 提供 了 许多 函数 方法 ， 每 个 函数 方法 用 于 实现 某 个 自动 化 操作 。 
于 Appium 是 在 Selenium 的 基础 上 进行 封装 ， 所 以 Appium 的 元 素 定 位 与 操作 采用 了 
Selenium 部 分 的 方法 。 在 讲述 元 素 定位 与 操作 之 前 ， 我 们 先 学 习 元 素 的 查找 方法 ，Android 
系统 的 元 素 查 找 需要 借助 软件 UI Automator Viewer 实现 。 以 手机 的 计算 器 为 例 ， 比 如 查找 
数字 6 的 元 素 属 性 ， 有 具体 操作 步骤 如 下 : 


(1) 将 手机 与 计算 机 进行 连接 ， 连 接 之 前 确保 手机 已 开启 USB 调试 模式 。 

(2) 唤醒 手机 屏幕 ， 当 手机 界面 上 出 现 USB 调试 提示 信息 时 ， 单 击 “ 确 定 ” 按 钮 并 
打开 手机 的 计算 器 。 

(3) 打开 软件 UI Automator Viewer， 单 击 “Device Screenshot” 按 钮 捕捉 手机 当前 
界面 。 

(4) 捕捉 成 功 后 ， 在 软件 的 左 侧 会 出 现 手机 界面 的 截图 ， 单 击 截图 的 数字 6， 该 数字 
的 相关 属性 都 会 展示 在 软件 的 右 侧 ， 这 些 属性 就 是 我 们 所 需 的 元 素 属性 ， 如 图 13-23 所 示 。 


Ul Automator Viewer 


sl[ale a 


Device Screenshot (uiautomator dump) 


(25) View [268,1399][270,1690] ^ 

A 二 三 业已 (26) Button:5 [270,1399][539,16 
局 

整个 界面 的 元 第 (27) View [539,1399][541,1690] 
(28) Button:6 [541,1399][810,16 
(29) View [810,1399][812,1690] 

(30) ImageView (0) [812,1399]| 、 
> 


全 某 个 元 素 信息 


com.android.calculator2:id/digit 6 
android.widget.Button 
com.android.calculator2 


false 
false 


图 13-23 ”元素 查找 
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数字 6 的 元 素 属 性 一 共有 17 个 ， 但 是 只 有 5 个 属性 能 用 于 元 素 定 位 ， 它 们 分 别 是 
index、text、resource-id、class 及 content-desc。 那 么 ，Appium 对 数字 6 的 定位 方法 如 下 : 


# 通过 index 定位 

# Appium 的 uiautomator 方法 

index = '28" 

ua = "new DiSelector() .index(' + index + ')" 

driver.find element by androidqd uiautomator (ua) .click() 


# 通过 text 定位 

# Appium 的 uiautomator 方法 

EexE = 6 

ua = "new UiSelector().text("' + text + '")" 
driver.find element by android uiautomator (ua) .click() 


# 通过 resource-id 定位 

resourceId = 'com.android.calculator2:id/digit 6' 

# Selenium 的 方法 

driver.find element by id(resourceId) 

# Appium 的 uiautomator 方法 

ua = 'new UiSelector() .resourceId("' + resourceId + '")' 
driver.find element by android uiautomator (ua) .click() 


# 通过 class 定位 

# Selenium 的 方法 

class name = "android.widget.Button'" 

driver.find element by class name (class_name) 


# 通过 content-desc 定位 

# Appium 的 uiautomator 方法 

# 由 于 数字 6 的 属性 值 为 空 ， 此 处 选取 按键 C 

description =' 清 除 ' 

ua = "new UiSelector () .description("' + description + '")' 
driver.find element by android uiautomator (ua) .click() 

# 方法 二 

driver.find element by accessibility id(" 清除 ') .click() 


# Xpath 定位 
xpath = '//android.widget.Button[contains (@text, "6")]" 
driver.find element by xpath (xpath) .click() 
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元 素 定位 主要 使 用 了 Selenium 的 方法 和 Appium 的 uiautomator 方法 实现 ， 在 这 5 个 属 
性 中 ， 除 了 元 素 属性 class 之 外 ， 其 余 四 个 元 素 属性 都 能 使 用 Appium 的 uiautomator 方法 进 
行 定位 ，Selenium 的 方法 只 适用 于 class 和 resource-id 属性 ， 而 Selenium 的 Xpath 方法 是 根 
据 元 素 的 布局 进行 定位 ， 它 能 用 于 任何 Android 应 用 程序 。 在 PyCharm 编写 代码 的 时 候 ， 
代码 提示 还 会 出 现 所 有 Selenium 的 定位 方法 ， 这 些 定位 方法 主要 用 于 手机 浏览 器 的 网 页 自 
动 化 开发 。 

使 用 Appium 的 uiautomator 方法 进行 元 素 定 位 的 时 候 ， 不 同 的 属性 有 不 同 的 代码 编写 
规则 ， 有 具体 的 差异 体现 在 上 述 代 码 的 变量 ua 上 ， 该 变量 ua 的 代码 格式 较为 固定 ， 只 有 细心 
观察 才能 发 现 其 差异 之 处 。 对 于 Xpath 定位 ， 需 要 掌握 Xpath 语法 才能 写 出 相应 的 定位 代 
码 ， 由 于 本 书 篇 幅 有 限 ， 就 不 做 详细 介绍 了 ， 有 兴趣 的 读者 可 以 自行 查阅 资料 。 


13.5 ”操控 元 素 


在 讲述 元 素 定 位 的 时 候 ， 定 位 后 的 元 素 都 执行 了 单 击 处 理 ， 该 操作 由 click0 方 法 实 
现 。 当 我 们 使 用 手机 的 时 候 ， 使 用 过 程 中 大 多 数 操作 都 是 单 击 、 文 本 输入 和 滑动 。 单 击 由 
click0 方 法 实现 ， 文 本 输入 由 send_keys() 方 法 实现 ， 滑 动 操 作 由 swipe() 方 法 实现 。 单 击 操 
作 在 上 一 节 的 代码 中 己 有 使 用 示例 ， 并 且 使 用 方法 相对 简单 ， 此 处 不 再 讲述 ， 下 面 主要 讲 
述 文本 输入 和 滑动 操作 。 

以 美 团 为 例 ， 单 击 首 页 顶部 的 搜索 文本 框 会 进入 一 个 搜索 页 面 ， 在 搜索 页 面 中 输入 相 
关 的 搜索 内 容 ， 如 图 13-24 所 示 。 


~ (0) Linearlayout [0.90)[1080234] 
(0) ImageView [0,132](135,192] 


四 多 jout [102901309.234] 
CD View o114I00142191 
(2) LinearLayout [207.118][930,205] 


oe 5) 
:meituanid/search_edit 


图 13-24 查找 元 素 信息 


根据 图 上 的 操作 步骤 ， 我 们 要 对 这 两 个 文本 框 进 
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行 单 击 操控 ， 第 二 个 文本 框 进行 文本 输入 操作 ， 具 体 的 实现 代码 如 下 : 


from appium import webdriver 

import time 

desired caps = { 
"PlatformName': 'Android', 
"PlatformVersion': '8.0°', 


'deviceName': "huawei-11ld_ al20-30KNW18730002140', 
"appPackage': 'com.sankuai.meituan', 


'appActivity': 'com.meituan.android.pt.homepage.activity. 


MainActivity', 
# 设置 中 文 输入 
'unicodeKeyboard': True, 
'resetKeyboard': True, 
下 
# 向 Appium-Server 发 送 请 求实 现 连接 


行 定位 并 操控 ， 第 一 个 文本 框 用 于 进 


driver = webdriver.Remote('http://localhost:4723/wd/hub', desired caps) 


time.sleep (3) 
# 单 击 系统 提示 框 


for i in range(2) : 


resourceId = 'com.android.packageinstaller:id/permission allow_button' 


driver.find element by id(resourceId) .click() 


time.sleep(3) 
# 单 击 首页 输入 框 


resourceId = 'com.sankuai.meituan:id/search_edit' 


driver.find _ element by _id(resourceId) .click() 


time.sleep (3) 
# 输入 搜索 内 容 


resourceId = 'com.sankuai.meituan:id/search edit' 
driver.find element by id(resourceId) .send keys(' 广州 长 隆 ' ) 


在 代码 中 ， 字 典 desired_caps 额外 设置 了 参数 unicodeKeyboard 和 resetKeyboard， 前 者 
是 将 键盘 输入 内 容 改 为 unicode 格式， 后 者 是 将 手机 的 输入 法 改 为 Appium 的 输入 法 。 只 有 
同时 设置 这 两 个 参数 ，Appium 才能 在 手机 上 输入 中 文 内 容 ， 和 否则 输入 的 内 容 会 变 成 乱码 。 


Appium 在 运行 Android 应 用 程序 的 时 候 ， 应 


态 ， 也 就 是 说 ，Appium 清除 了 用 户 在 这 个 应 上 


上 的 使 


功 后 ， 系 统 会 出 现 相应 的 系统 提示 框 ， 因 此 在 执行 自动 化 操作 之 前 ， 还 需要 对 


示 进 行 相应 的 处 理 才 能 执行 下 一 步 的 操作 ， 如 


用 程序 在 启动 时 是 处 于 一 种 初始 化 的 状 


痕迹 。 当 Android 应 上 


程序 启动 成 


图 13-25 所 示 。 


| 这 些 系 统 提 
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第 1 夺权 限 供 2 贡 


“ 美 团 " 需 要 使 用 您 的 位 置 权 限 ,您 是 否 允 许 ? 


禁止 后 不 再 询问 


禁止 


图 13-25 系统 提示 框 
Appium 的 滑动 操作 可 以 分 为 上 滑 、 下 滑 、 左 滑 和 右 滑 ， 不 管 哪 一 种 滑动 ， 它 们 都 是 
swipe() 方 法 实现 的 ， 只 要 对 swipe0 方 法 传 入 不 同 的 参数 就 能 实现 不 同 的 滑动 方式 ， 
swipe0 方 法 的 定义 如 下 : 


swipe (int start x, int start y, int end x, int y, duration) 


参数 说 明 : 


int start x 开始 滑动 的 x 坐标 

int starty 开始 滑动 的 y 坐 标 
intendx 结束 点 x 坐标 

intendy 结束 点 y 坐 标 

duration ”滑动 时 间 (默认 5 毫秒 ) 


从 swipe() 方 法 定义 可 以 看 到 ， 滑 动 屏幕 需要 借助 屏幕 上 的 坐标 位 置 ， 由 于 每 台 手机 的 
分 辨 率 和 尺寸 大 小 不 同 ， 如 果 将 滑动 位 置 设 为 一 个 固定 的 坐标 ， 在 其 他 手机 上 不 一 定 能 ; 
目 ， 所 以 只 能 够 根据 手机 的 屏幕 大 小 来 制定 滑动 位 置 。Appium 提 供 了 相应 的 方法 来 获取 手 
机 屏幕 的 尺寸 大 小 ， 实 现 过 程 如 下 : 

# 获得 手机 屏幕 分 辨 率 x,Y 


def getSize() : 
x = driver.get window size()['width'] 


mn 


Y = driver.get window size()['height'] 
return (x, y) 


函数 getSizeO) 是 我 们 自 定义 的 函数 ， 在 函数 中 使 用 Appium 的 get_window_size0 方 法 
来 获取 手机 屏幕 分 辨 率 。 每 台 手 机 的 坐标 点 都 是 以 左上 方 为 起 点 ， 右 下 方 为 终点 ， 这 与 计 
算 机 屏幕 分 辨 率 的 坐标 点 分 布 原理 是 相同 的 ， 如 图 13-26 所 示 。 

滑动 屏幕 主要 是 在 屏幕 的 正中 位 置 进 行 的 ， 从 函数 getSize0 的 返回 值 可 以 计算 不 同位 
置 的 坐标 点 ， 有 了 这 些 坐 标点 就 可 以 实现 屏幕 滑动 ， 每 种 滑动 方式 的 实现 代码 如 下 所 示 : 
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# 向 上 滑动 
def swipeUp (t) : 
local = getSize() 
x = nt(iocaLt0) * 0.5) 
yl = int(local[ll] * 0.75) 
y2 = int(local[1] * 0.25) 
driver.swipe (x, yl, x, y2, t) 


# 向 下 滑动 
def swipeDown (t) : 
local = getSize() 
x = int(local[0] * 0.5) 
yl = int(local[1] * 0.25) 
y2 = int(local[1] * 0.75) 
driver.swipe(x, yl, x, y2, t) 


# 向 左 滑动 
def swipLeft (t): 
local = getSize() 
xl = int(local[0] * 0.75) 
y = int(local[1] * 0.5) 
x2 = int(local[0] * 0.05) 
driver.swipe (xl, y, x2, y, 七 ) 


# 向 右 滑动 
def swipRight (t): 
local = getSize() 
xl = int(local[0] * 0.05) 
y = int(Llocal[1] * 0.5) 
x2 = int(local[0] * 0.75) 
driver.swipe (xl, y, x2, y, 七 ) 


不 同 的 滑动 方式 对 swipe0 的 参数 有 不 同 的 设置 。 比 如 向 上 滑动 ，X 坐标 的 起 始 位 置 与 
结束 位 置 固定 不 变 ，Y 坐 标的 起 始 位 置 是 屏幕 的 3/4 位 置 ， 结 束 位 置 是 屏幕 的 /4 位 置 ， 也 
就 是 从 下 往 上 滑动 ， 如 图 13-27 所 示 。 每 个 函数 的 参数 1 代表 滑动 时 间 ， 参 数值 的 大 小 会 直 
接 影 响 滑动 效果 ， 一 般 设置 为 1000， 如 果 使 用 swipe0 的 默认 值 5 毫秒 ， 则 在 手机 上 完全 没 
有 滑动 效果 。 


全 
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屏幕 的 1/4 位 置 


~ 


屏幕 的 3/4 位 置 


图 13-26 “手机 屏幕 分 辩 率 图 13-27 手机 屏幕 位 置 
除了 上 述 的 自动 化 操作 之 外 ，Appium 还 提供 了 许多 实用 的 操作 功能 方法 。 这 些 方法 都 由 
driver 对 象 使 用 ， 它 们 定义 在 Python 安装 目录 \Lib\site-packages\appium\webdriver\webdriver.py， 
每 种 方法 所 实现 的 功能 以 及 参数 都 有 注释 说 明 ， 有 兴趣 的 读者 可 以 自行 查阅 。 


13.6 ”实战 .淘宝 商品 采集 


通过 前 面 的 学 习 ， 相 信 大 家 对 Appium 的 自动 化 开发 有 了 一 定 的 了 解 和 掌握 ， 在 本 节 
中 ， 我 们 以 手机 淘宝 的 商品 信息 采集 为 例 ， 进 一 步 掌 握 Appium 的 开发 。 整 个 项 目的 业务 
流程 大 致 如 下 : 


(1) Appium 启动 手机 淘宝 app， 并 处 理 Android 系统 的 提示 信息 。 
(2) 单 击 淘宝 首页 顶部 的 搜索 框 ， 进 入 淘宝 的 搜索 界面 。 

(3) 在 搜索 界面 输入 搜索 内 容 并 单 击 “搜索 ”按钮 。 

(4) 进入 商品 界面 ， 单 击 “ 销 量 ” 按 钮 ， 将 商品 以 销量 排序 。 

(5) 读 取 当 前 界面 的 商品 信息 ， 对 每 条 信息 进行 去 重 和 写 入 处 理 。 
(6) 在 商品 界面 执行 向 上 滑动 ， 读 取 其 他 商品 信息 ， 重 复 执行 步 又 5。 


分 析 上 述 业 务 流程 ， 可 知道 在 手机 淘宝 App 里 需要 定位 的 元 素 分 别 有 : 淘宝 首页 搜索 
框 、 搜 索 界 面 的 搜索 框 、 商 品 信 息 界面 的 “销量 ”按钮 以 及 商品 信息 的 标题 和 价格 。 在 软 
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件 UI Automator Viewer 里 分 别 定位 并 查找 这 些 元 素 信息 ， 若 软件 在 截取 手机 界面 时 出 现 报 
错 ， 请 先 关 闭 Appium 服务 器 再 次 执行 截取 操作 ， 因 为 Appium 服务 器 会 对 软件 的 使 用 有 
定 的 影响 。 
打开 手机 淘宝 ， 使 用 软件 UI Automator Viewer 截取 整个 淘宝 首页 的 元 素 信息 ， 单 击 软 
件 截 图 的 搜索 框 ， 发 现 搜索 框 可 以 通过 index、resource-id 和 class 属性 进行 定位 ， 如 图 
13-28 所 示 。 元 素 的 text 属性 虽然 有 属性 值 ， 但 是 每 次 打开 淘宝 都 会 发 现 text 的 属性 值 是 不 
相同 的 。 属 性 class 可 以 在 一 个 界面 里 重复 使 用 ， 但 是 此 界面 只 有 一 个 搜索 框 ， 因 此 class 
属性 也 能 实现 定位 。 在 选择 属性 进行 定位 的 时 候 ， 需 要 结合 实际 情况 来 分 析 每 个 属性 是 否 
可 行 。 以 resource-id 定位 为 例 ， 代 码 如 下 所 示 : 
单 击 首页 搜索 框 


resourceld = 'com.taobao.taobao:id/home searchedit'" 


driver.find element by _ id(resourceId) .click() 


FrameLayout [0,0][1080,234] 
r 


时 
送 15 件 套 实木 家 居 仿 (0) LinearLayout [0,90][1080,234] 


(0) LinearLayout { 扫 一 扫 } [0,90][150,234] 
Y (TD FrameLayout [150,112][930,211] 
v (0) RelativeLayout [180,112][900,211] 
(0) TextView: 妇 ( 近 索 } [180,112][246,211] 
(1) View [180,208][900,211] 
(2) EditText: 毛 衣 慷 侧 [246,112][807,211] 
(3) TextView- 刘 ( 拍 立 海 } [807.11211900.2111 


lode Detail 
index 2 
text 毛衣 慷 侧 
全 堪 获 神 价 后 名 用 和 resource-id com.taobao.taobao:id/home searchedit 
class android.widget.EditText 
package com.taobao.taobao 
content-desc 
O snn oDo 全 有 好 贰 checkable 
checked 
clickable 


Ec 2 


图 13-28 ”淘宝 首页 搜索 框 


单 击 首页 的 搜索 框 后 会 进入 到 搜索 界面 ， 搜 索 界面 的 搜索 框 与 首页 的 搜索 框 是 不 同 的 
元 素 ， 需 要 重新 对 搜索 界面 的 搜索 框 进行 信息 截取 ， 如 图 13-29 所 示 。 在 搜索 框 中 输入 商 
品 的 关键 词 ， 并 单 击 搜索 框 右 侧 的 “搜索 ”按钮 就 能 搜索 相关 的 商品 信息 。 搜 索 框 和 “ 搜 
索 ” 按 钮 的 定位 以 resource-id 为 例 ， 实 现代 码 如 下 所 示 : 
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巧 ， 


单位 
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he 中 针织 标 女 
元 本 秋 回 竟 电 全 


一 必 只 昌 圣 更 过 


< 


~ (0) RelativeLayout [0.901[1080.234] 
(0) ImageView {返回 上 一 页 } [0,102][168,222] 
Y (TD UnearLayout [168,120][885,204] 
(0) EditText: 毛 衣 贮 全 [213,120][744,204] 
(TD TextView- 刘 { 拍 立 淘 } [744,120][840,204] 
( Button: 瘦 索 (六 款 } [912.1201[1056.204] 
(1) RelativeLayout [0.234][1080,2280] 
v (2) FrameLayout [0,234][1080,378] 
~_(0) HorizontalScrollView 10.2341[1080.3781 


Node Detail 


0 

毛衣 坊 佛 
com.taobao.taobao:id/searchEdit 
android.widget.EditText 
com.taobao.taobao 


enabled 


量 按 住 说 出 你 要 的 宝贝 


图 13-29 


# 输入 搜索 内 容 
text = ' 玩 转 Python 网 络 扑 虫 


resourceld = 'com.taobao.taobao 


focusable 


搜索 界面 的 搜索 框 


:id/searchEdit'" 


driver.find element by id(resourceId) .send keys (text) 


# 单 击 搜索 按钮 


resourceld = 'com.taobao.taobao 


:id/searchbtn'" 


driver.find element by id(resourceId) .click() 


搜索 所 得 的 商品 信息 显示 在 商品 界面 上 ， 在 该 界面 上 单 击 “ 销 量 ” 按 钮 ， 将 所 有 的 商 
品 按照 销量 的 大 小 重新 排序 ， 从 图 13-30 得 知 ，“ 销 量 ” 按 钮 的 属性 text 相 比 其 他 属性 较为 
稳定 而 且 具 有 唯一 性 ， 因 此 该 按钮 以 属性 text 进行 定位 ， 代 码 如 下 所 示 。 


# 单 击 销量 排序 


sales = 'new UiSelector() .description ("销量 ")' 


driver.find element by android uiautomator (sales) .click() 


我 们 对 排序 后 的 商品 进行 信息 采集 ， 
再 将 这 个 字典 存放 到 一 个 列表 中 。 从 


将 每 条 商品 的 标题 和 价钱 写 入 到 一 个 新 的 字典 
图 13-31 看 到 ， 每 条 商品 以 RelativeLayonut 元 素 为 


， 每 个 RelativeLayout 元 素 都 包含 了 商品 的 标题 、 价 钱 以 及 运费 等 信息 。 因 此 先 定位 所 


有 的 RelativeLayout 元 素 ， 再 对 这 些 元 素 进行 遍历 处 理 ， 每 次 遍历 获取 相应 的 标题 和 价钱 ， 


具体 


为 代码 如 下 : 
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所 ”元 转 python 网 络 竹 虫 


(0) View [0,497][1080,498] 
Y (TD LinearLayout [36,378][719,498] 
》 (0) LinearLayout [36,378][263,498] 
Y (TD LinearLayout [263,402][491,474] 
(0) TextView: 销 县 { 销 量 已 选中 } [335,402][419,474] 

(2) LinearLayout [491,402][719,474] 

(2 TextView: 主 {大 图 模式 } [719,378][839,498] 

(3) View [839,378][840,498] 


油 3 件 包 闻 玩 轩 Py TAN Belasivel osm tAAN 27mr1NAN 4amn 


网 痢 妥 外 全 水 祥 97673 4 


Node Detail 
420 index 0 
机 text 销量 
和 正版 现 余 玩 转 Python resource-id com.taobao.taobao:id/show text 
NN class android.widget.TextView 
om package comtaobaotaobao 
"Sls content-desc 


checkable 
加 正 厂 于 转 Python 网 
络 和 扑 计算 机 程序 设计 P. checked 
s clickable 
Bw 


BE enabled 


图 13-30 ”商品 界面 的 “销量 ”按钮 


玩 畦 python 网 络 轩 虫 
(1) TextView: 玩 转 python 网络 息 忠 Python 程序 设计 Py 
(2) LinearLayout [496,664][1040,709] 
(3) View { 包 邮 } [496,735][1022,771] 
(4) View {价格 45 元 5 人 收 贷 兰州 } [496,795][1040,870] 
> (5) LinearLayout {496,870][950,914] 

(9 TextView:.… {更 多 } [950,842][1040,932] 

Y (3) RelativeLayout [4,954][1076,1410] 
(0) ImageView [40,972][460,1392] 


人 1 TevtViawr 沽 3 件 句 邮 村 站 Dwhan 网 络 知 由 茶 齐 拌 075 
> 


测 3 件 色 却 乓 转 Python 
网 阁 限 宝 林 永 祥 978730 


“20 i 1 
a 玩 转 Python 网 络 相 中 python 程序 设计 Pyt..。 


加 正 乒 现货 玩 转 Python resource-id com.taobao.taobao:id/title 
网 络 网 宝 程序 设计 Python. 


class android.widget.TextView 


sn package comtaobaotaobao 


ls content-desc 


9 正版 元 转 Python 网 
络 阳 宝 计算 机 程序 设计 P 
dlickable 


enabled 


"45 


图 13-31 商品 信息 的 标题 
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MyList = [] 


# 滑动 屏幕 5 次 
for t in range(5): 
# 定位 所 有 RelativeLayout 元 素 


FresourceId = 'com.taobao.taobao:id/auction layout" 


info = 


driver.find elements by id(resourceId) 


check and delay() 
# 遍历 每 个 RelativeLayout 元 素 
f6r 1 in info 


try: 


MyDict = {} 
# 获取 标题 
resourceld = 'com.taobao.taobao:id/title' 
title = i.find element by id(resourceId) 
MyDict['title'] = title.text.strip() 
# 获取 价格 
FesourceId = 'com.taobao.taobao:id/priceBlock' 
Price = i.find element by id(resourceId) 
MyDict['price'] = price.get attribute("contentDescription") 
# 去 重 并 写 入 列表 
if MyDict not in MyList: 

MyList.append (MyDict) 


except: pass 
# 滑动 屏幕 
swipeUp (1000) 
在 每 个 元 素 之 间 加 入 延 时 等 待 ， 因 为 商品 的 搜索 和 销量 排序 都 是 从 淘宝 的 服务 器 获取 
数据 ， 这 个 获取 过 程 都 会 涉及 网 络 延 时 ， 所 以 加 入 延 时 功能 是 更 好 地 协调 自动 化 操作 与 应 


yy 


程序 的 响应 ， 使 两 者 尽量 保持 同步 执行 。 


除 此 之 外 ，Appium 在 启动 Android 应 用 的 时 候 ， 在 应 用 界面 中 都 会 出 现 系统 提示 框 ， 
我 们 将 提示 框 的 处 理 和 延 时 功能 都 定义 在 一 个 函数 里 实现 。 综 合 上 述 分 析 ， 整 个 项 目的 功 
能 代码 如 下 所 示 : 


from appium import webdriver 


import time 


# 延 时 与 检测 系统 提示 
def check and delay (ts=10): 


time.sleep (ts) 


bh 


driver.find element by id('android:id/button1l') .click() 
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except: pass 


# 获得 屏幕 坐标 x,y 

def getSize() : 
xX = driver.get window size()['width'] 
Y = driver.get window size()['height'] 


return (x, y) 


# 屏幕 向 上 滑动 
def swipeUp (t) : 
local = getSize() 
x = int(local[0] * 0.75) 
int (locall[1l] * 0.75) 
y2 int (local[1l] * 0.25) 
driver- swipe(x; yl; x Y2,. E) 


< 
> 
外 


4 name == " maim ™s 


desired caps = { 
'platformName': 'Android', 
'platformVersion': '8.0°', 
'deviceName': 'huawei-lld al20-30KNW18730002140', 
'appPackage': 'com.taobao.taobao', 


'appActivity': 'com.taobao.tao.homepage.MainActivity3', 
# 设置 中 文 输入 
'unicodeKeyboard': True, 
'resetKeyboard': True, 
} 
driver = webdriver.Remote('http://localhost:4723/wd/hub', desired caps) 
# 单 击 首页 搜索 框 
# 延 时 20 秒 是 更 好 地 等 待 系 统 提示 框 的 出 现 
check and delay(20) 
resourceId = 'com.taobao.taobao:id/home searchedit" 
driver.find element by id(resourceId) .click() 
check and delay() 
# 单 击 搜索 页 的 搜索 框 
text = ' 玩 转 Python 网 络 扑 虫 


resourceId = 'com.taobao.taobao:id/searchEdit'" 


driver.find element by id(resourceId) .send keys (text) 
check and delay() 
# 输入 搜索 内 容 


resourceId = 'com.taobao.taobao:id/searchbtn' 
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driver.find element by id(resourceId) .click() 
check and delay() 
# 单 击 销量 排序 


sales = 'new UiSelector() .description(" 销 量 ")" 


driver.find element by android uiautomator (sales) .click() 
Check and delay() 
# 数据 写 入 
MyList = [] 
for t in range(5): 
FresourceId = 'com.taobao.taobao:id/auction layout' 
info = driver.find elements by id(resourceId) 
check and delay() 
for 1 in infos 
地 
MyDict = {} 
# 获取 标题 
resourceld = 'com.taobao.taobao:id/title' 
title = i.find element by id(resourceId) 


MyDict['title'] = title.text.strip() 
# 获取 价格 
resourceId = 'com.taobao.taobao:id/priceBlock' 


price = i.find element by id(resourceId) 
MyDict['price'] = price.get attribute("contentDescription") 
# 去 重 并 写 入 列表 
if MyDict not in MyList: 
MyList.append (MyDict) 
except: pass 
# 滑动 屏幕 
swipeUp (1000) 
print (MyList) 
# 关闭 淘宝 App 


driver.quit () 


13.7 ”本 章 小 结 


Appium 是 一 个 开源 、 跨 平台 的 测试 框架 ， 可 以 用 来 测试 原生 及 混合 的 移动 端 应 用 ， 
支持 1OS、Android 及 FirefoxOS 平台 。 
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在 Windows 系统 上 搭建 Appium 开发 环境 ， 需 要 安装 Java JDK、Android SDK、 
Node.JS、Appium-Server 和 Appium-Client， 有 具体 的 安装 说 明 如 下 。 


(1) JavaJDK: 搭建 Java 的 开发 环境 。 

(2) Android SDK: Android 软件 开发 包 ， 基 于 Java 的 开发 环境 运行 ， 可 以 在 计算 机 
启用 Android 模拟 器 或 者 连接 Android 手机 。 

(3) Node.JS: 搭建 Node.JS 的 开发 环境 。 

(4) Appium-Server: 安装 Appium 的 服务 器 ， 基 于 Node.JS 的 开发 环境 运行 。 

(5) Appium-Client: 安装 Appium 的 客户 端 ， 编 写 并 运行 Appium 自动 化 代码 。 


Appium 与 Android 通信 连接 的 代码 是 相对 比较 固定 的 ， 在 连接 代码 中 根据 Android 系 
统 信息 进行 相应 的 修改 即 可 实现 连接 。Appium 设置 了 许多 连接 参数 ， 不 同 的 参数 负责 实现 
不 同 的 功能 ， 这 些 功能 主要 是 对 Android 系统 进行 设置 ， 以 便 满 足 我 们 开发 需求 。 

Android 系统 的 元 素 查找 需要 借助 软件 UI Automator Viewer 实现 ， 有 具体 操作 步骤 
如 下 : 


(1) 将 手机 与 计算 机 进行 连接 ， 连 接 之 前 确保 手机 已 开启 USB 调试 模式 。 

(2) 唤醒 手机 屏幕 ， 当 手机 界面 出 现 USB 调试 提示 信息 ， 单 击 “ 确 定 ” 按 钮 。 

(3) 打开 软件 UI Automator Viewer， 单 击 “Device Screenshot ”按钮 捕捉 手机 当前 
界面 。 

(4) 捕捉 成 功 后 ， 在 软件 的 左 侧 出 现 手机 界面 的 截图 ， 在 截图 里 单 击 某 个 元 素 可 获取 
该 元 素 信息 。 


了 


Appium 对 元 素 的 定位 与 操作 是 在 Selenium 的 基础 上 进行 实现 和 扩展 ， 具 体 的 定位 与 操 
作 方 法 可 以 在 Python 安装 目录 \Lib\site-packages\appium\webdriver\webdriver.py 文件 里 查阅 。 


Flask 入 门 基础 


本 章 讲述 Python 的 Web 框架 一 一 Flask 入 门 知识 。Flask 主要 用 来 开发 网 站 应 用 ， 阐 述 
Flask 框架 是 让 读者 掌握 简单 的 网 站 开发 技术 ， 自 主 开 发 自动 化 系统 ， 用 于 管理 自动 化 程 
序 。Flask 入 门 知 识 包括 了 环境 搭建 、 路 由 编写 、 请 求 参 数 传递 与 获取 以 及 响应 过 程 。 


14.1 概述 与 安装 


因为 下 一 章 我 们 的 自动 化 系统 会 用 到 Flask， 所 以 本 章 先 对 Flask 做 一 个 快速 讲解 。 

相信 大 家 对 网 站 开发 的 一 些 基 础 知识 都 有 所 了 解 ， 网 站 开发 可 以 使 用 多 种 编程 语言 实 
现 ， 只 不 过 实现 过 程 和 编码 方式 有 所 不 同 ， 但 开发 原理 都 是 相同 的 。 对 于 Python 来 说 ， 网 
站 开发 的 主流 框架 有 Django、Flask 和 Tomado， 有 一 定 规模 的 企业 都 是 首选 Django 框架 ， 
而 小 企业 或 创业 公司 会 选择 Flask 框架 ， 因 为 Flask 可 以 快速 开发 网 站 ， 而 且 入 门 也 相对 简 
单 。 如 果 读 者 对 Django 有 学 习 兴 趣 ， 可 查阅 笔者 的 《 玩 转 Django 2.0》。 

Python 的 Flask 是 受 Sinatra Ruby 框 架 启 发 ， 并 基于 Werkzeug 和 Jinja2 开发 而 成 的 Web 
框架 ， 它 与 大 多 数 Python 的 Web 框架 相 比 相当 年 轻 ， 但 具有 很 好 的 发 展 前 景 ， 并 且 已 经 在 
Python Web 开发 人 员 中 流行 起 来 。 
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Flask 的 设计 易于 使 用 和 扩展 ， 依 赖 于 两 个 外 部 库 : Jinja2 模板 引擎 和 Werkzeug WSGI 
工具 包 。 它 的 初衷 是 为 各 种 复杂 的 Web 应 用 程序 构建 坚实 的 基础 ，Python Web 开发 人 员 可 
以 自由 地 插入 任何 扩展 ， 也 可 以 自由 构建 自己 的 模块 ， 具 有 很 强 的 扩展 性 。Flask 具有 开 箱 
即 用 的 优点 ， 并 有 以 下 的 特点 : 


(1) 内 置 开 发 服务 器 和 快速 调试 器 。 
(2) 集成 支持 单元 测试 。 

(3) RESTful 可 请 求 调度 。 

(4) Jinja2 模板 。 

(5) 支持 安全 cookie (客户 端 会 话 ) 。 
(6) 符合 WSGI 1.0。 

(7) 基于 Unicode。 


总 而 言 之 ，Flask 是 最 精简 且 功 能 最 丰富 的 微 框架 之 一 ， 它 拥有 蓬勃 发 展 的 社区 ， 丰 富 
的 扩展 模块 和 完善 的 API， 且 具有 快速 开发 、 强 大 的 WSGI 功能 、Web 应 用 程序 的 单元 可 
测 性 以 及 大 量 文档 等 优点 。 

Flask 的 安装 可 以 使 用 pip 指令 完成 ， 在 Windows 的 CMD 窗口 下 输入 pip install flask 


并 按 回 车 键 等 待 安装 即 可 。 安 装 成 功 后 进入 Python 交互 模式 ， 验 证 是 否 安装 成 功 ， 验 证 方 
法 如 图 14-1 所 示 。 


图 14-1 验证 方法 


14.2 ”快速 实现 一 个 简单 的 网 站 系统 


本 节 介绍 如 何 使 用 Flask 开发 网 站 系统 。 首 先 创建 main.py 文件 ， 在 该 文件 里 编写 
以 Se ea 个 简单 的 网 站 系统 ， 代 码 如 下 : 


# 导入 Flask 
from flask import Flask 
# 创建 一 个 Flask 实例 
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app = Flask( name ) 


# 设置 路 由 地 址 ， 即 网 页 地 址 ， 也 称 为 url 
Q@app.route('/') 
# url 的 处 理 函 数 
def hello world() : 
# 返回 的 网 页 


return "Hel1lo Wor1ld! 


站 name == ' main ': 


app.run 1() 


上 述 代码 主要 分 为 三 部 分 : Flask 实例 化 、 定 义 网 站 的 路 由 地 址 和 函数 、 网 站 的 运行 入 
三 者 的 说 明 如 下 。 


@ Flask 实 例 化 : 这 是 通过 Python 的 Flask 模 块 实例 化 ， 因 为 Python 是 面向 对 象 编程 语言 ， 
而 实例 化 是 创建 一 个 Flask 对 象 ， 它 代表 整个 网 站 系统 。 

@ 定义 网 站 的 路 由 地 址 和 函数 : 网 站 路 由 由 Flask 对 和 象 app 的 route 装 饰 器 定义 ， 它 对 网 站 系 
统 添 加 网 站 地 址 ， 每 个 网 站 地 址 都 由 一 个 路 由 函数 处 理 ， 这 个 函数 用 于 响应 用 户 的 请 
求 ， 比 如 用 户 在 浏览 器 上 访问 这 个 网 址 ， 那 么 网 站 系统 必须 对 用 户 的 HTTP 请 求 做 出 响 
应 ， 这 个 响应 过 程 就 是 由 这 个 路 由 函数 处 理 和 实现 的 。 

@ 网 站 的 运行 入 口 : 用 于 启动 并 运行 网 站 ， 由 app 对 象 的 run() 方 法 实现 。run() 方 法 里 可 以 
设置 相应 的 参数 来 设置 网 站 的 运行 方式 。 


在 PyCharm 或 Windows 的 CMD 窗口 下 运行 main.py 文件 ， 本 书 以 PyCharm 为 例 ， 文 
件 的 运行 结果 如 图 14-2 所 示 ; 在 图 14-2 中 单 击 链接 http://127.0.0.1:5000/， 浏 览 器 会 自动 弹 
出 该 链接 的 网 页 信息 ， 如 图 14-3 所 示 ， 并 且 在 图 14-2 中 也 会 出 现 用 户 的 请 求 信息 。 


D:\Python\python. exe D:/main. py 


* Serving Flask app“main” (lazy loading) 
* Environment: production 
WARNING: Do not use the development server in a production environment. 


Use a production WSGI server instead. 用 户 的 Http 请 求 
* Debug mode: off 
不 Running on http://127. 0.0.1:5000/ (Press CTRL+C to quit) 
[ :29] "GET / HTTP/L.1” 200- 


图 14-2 main.py 文件 运行 结果 
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口 127.0.0.1:5000 x 


CG |© 127.0.0.1:5000 


Hello World! 


图 14-3 网 页 信息 


14.3 ”路 由 编写 规则 


在 上 一 节 中 ， 路 由 地 址 是 以 “/” 表 示 的 ， 而 在 浏览 器 却 变 成 了 http://127.0.0.1:5000/。 
因为 路 由 地 址 第 一 个 “/” 表 示 网 站 的 域名 或 他 地 址 ， 也 就 是 我 们 常 说 的 网 站 首页 。 网 站 的 
路 由 地 址 编写 规则 与 Windows 的 文件 目录 路 径 是 相似 的 ， 每 个 “/” 代 表 不 同 的 路 由 等 级 ， 
每 个 路 由 等 级 的 命名 可 以 是 固定 的 或 以 变量 表示 ， 如 下 所 示 : 

# 路 由 地 址 : http://127.0.0.1:5000/user/ 


@app.route('/user/') 
def user(): 


return 'This is user center' 


# 路 由 地 址 : http://127.0.0.1:5000/user/xxx 
# xxx 可 代表 任意 内 容 
@app.route('/user/<types>') 
def userCenter (types): 
return "This is user's " + types + " page" 


上 述 例 子 设置 了 两 个 不 同等 级 的 路 由 地 址 ， 通 常情 况 下 网 站 首页 (“/”) 称 为 根 目 录 ， 
路 由 Vuser 代表 网 站 的 二 级 目录 ; 而 '/user/<types>' 是 /user/ 下 的 子 目 录 ， 也 是 网 站 的 三 级 目 
录 ， 其 中 <types> 是 一 个 变量 ， 可 代表 任意 内 容 ， 并 且 路 由 的 变量 可 以 传递 到 路 由 函数 
userCenter 里 使 用 。 

在 路 由 中 设置 变量 可 对 路 由 进行 精简 处 理 ， 比 如 路 由 地 址 中 设 有 日 期 格式 ， 若 按照 
来 计算 ， 每 天 就 要 设 定 一 个 路 由 地 址 ， 那 么 一 年 就 需要 设置 365 个 路 由 ， 如 果 将 日 期 设 
为 变量 表示 ， 只 需 一 个 路 由 即 可 解决 。 在 浏览 器 上 分 别 将 路 由 变量 设 为 login、logout 和 
relogin， 网 站 会 将 变量 值 显示 到 网 页 上 ， 如 图 14-4 所 示 。 


片 
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口 127.0.0.1:5000/user/loc x 


€ C |© 127.00.1 so00/use 由 ogin | 


Thisis user'glogin| page 


DD 127.0.0.1:5000/user/loc x 
和 GG |© 127.0.0.1:5000/use 


This is user'g 


口 127.0.0.1:5000/user/rel x 


C |© 127.0.0.1:5000/us 


This is user'g 


图 14-4 路 由 变量 


路 由 的 编写 规则 还 可 以 设置 HTTP 请 求 ，HTTP 的 请 求 方 法 有 GET、POST、 
OPTIONS、PUT、DELETE、TRACE 和 CONNECT 方 法 。 一 般 情况 下 ，GET 和 POST 方 法 
是 最 为 常用 的 HTTP 请 求 ，GET 请 求 是 从 网 站 中 获取 数据 并 显示 在 浏览 器 上 ，POST 请 求 是 
将 用 户 输入 在 浏览 器 的 数据 提交 到 网 站 系统 里 进行 处 理 。 同 一 个 路 由 地 址 可 以 设置 不 同 的 
HTTP 请 求 方式 ， 并 可 以 设置 每 种 请 求 方式 的 处 理 方法 ， 具 体 代码 如 下 : 


# 导入 request 方法 
from flask import request 
# 参数 methods 是 设置 HTTP 请 求 方法 
Q@app.route('/user/', methods=['GET', 'POST']) 
def user(): 

# 判断 当前 的 请 求 方式 ， 执 行 不 同 的 处 理 

if request.method == 'GET': 

return "This is user center' 


else: 
return 'This is My center' 


当 用 户 在 浏览 器 上 访问 http://127.0.0.1:5000/user/ 的 时 候 ， 实 质 上 是 对 网 站 发 送 一 个 
HTTP 的 GET 请 求 ， 网 站 收 到 请 求 后 ， 在 路 由 函数 user 里 判断 请 求 类 型 ， 再 根据 请 求 类 型 
执行 相应 的 处 理 ， 最 后 将 处 理 结 果 返 回 到 浏览 
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14.4 ”请求 参数 


网 站 是 通过 HTTP 协议 与 用 户 实现 数据 传输 ， 而 HITP 请 求 是 以 GET 和 POST 方法 为 
主 。 用 户 每 次 与 网 站 进行 交互 的 时 候 ， 在 交互 的 过 程 可 能 需要 发 送 相应 的 数据 信息 ， 比 如 
POST 方法 是 将 用 户 在 浏览 器 输入 的 数据 提交 到 网 站 ， 而 这 些 提交 的 数据 称 为 请 求 参数 。 
在 网 站 中 ， 不 同 的 请 求 方式 对 请 求 参 数 的 获取 也 有 所 不 同 ， 但 获取 方法 都 是 由 Flask 
的 request 模块 实现 的 。 首 先 了 解 GET 和 POST 的 请 求 参数 格式 ，GET 请 求 参数 是 附加 在 
路 由 地 址 并 以 “? ”表示 的 ，“? ”后 面 的 信息 是 请 求 参 数 ， 每 个 参数 以 A=B 的 形式 表示 ，A 
是 参数 名 ，B 是 参数 值 ， 如 果 有 多 个 请 求 参 数 ， 每 个 参数 之 间 以 “&” 隔 开 ， 如 下 所 示 : 

# 请 求 参数 分 别 有 name 和 password， 参 数值 分 别 为 python 和 helloworld 

http://127.0.0.1:5000/user/login?name=pythongpassword=helloworld 


POST 的 请 求 参数 以 JSON 格式 表示 ， 它 不 会 附加 在 路 由 地 址 上 ， 因 为 路 由 地 址 的 内 容 
长 度 是 有 限制 的 ， 而 POST 的 请 求 参 数 往往 会 超出 路 由 地 址 的 限制 。 在 发 送 POST 请 求 的 时 
候 ， 它 会 随 着 路 由 地 址 一 并 发 送 到 网 站 系统 ， 请 求 参数 的 格式 如 下 : 


{ 
"name": "python", 


"password": "helloworld" 
3 


不 管 是 哪 一 种 请 求 方式 ， 它 们 的 请 求 参数 都 是 相似 的 ， 每 个 参数 具有 参数 名 和 参数 
值 。 在 网 站 中 ， 请 求 参 数 的 获取 方法 如 下 : 


from flask import request 
@app.route('/user/<types>', methods=['GET', 'POST']) 
def userCenter (types): 
# 获取 GET 的 请 求 参数 
if request.method == 'GET': 
name = request.args.get ('name') 
password = request.args.get ('password') 
# 获取 PosT 的 请 求 参数 
elses 


name = request.form.get ('name') 
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password = request.form.get ('password') 


return "This is ”+ types + " 


page,Your name is " + name 


在 获取 请 求 参 数 的 参数 值 之 前 ， 必 须 对 请 求 方式 进行 判断 ， 否 则 网 站 系统 会 对 该 请 求 
视 为 GET 请 求 。 不 同 的 请 求 方式 ， 请 求 参数 的 参数 值 获取 方式 各 不 相同 ， 这 一 原则 不 仅 体 
现在 Flask 框架 上 ， 对 于 大 多 数 的 Web 框架 也 都 适用 。 


14.5 ”响应 过 程 


当 收 到 用 户 的 请 求 时 ， 网 站 会 根据 请 求 的 内 容 进 行 处 理 ， 处 理 过 程 由 路 由 函数 实现 。 


入 眶 


到 用 户 这 一 过 程 ， 我 们 称 之 为 响应 过 程 。 
响应 过 程 由 路 由 函数 的 retum 方法 实 


路 由 函数 完成 请 求 处 理 后 ， 下 一 步 是 将 处 理 结果 返回 到 浏览 器 ; 浏览 器 收 到 处 理 结 果 
也 称 为 响应 内 容 ) ， 根 据 响 应 内 容 生成 相应 的 网 页 给 用 户 浏览 。 从 网 站 将 处 理 结果 返 


孔 


岗 。 对 于 Python 来 说 ， 函 数 的 returm 是 将 函数 里 


的 数据 返回 到 函数 外 使 用 ， 对 于 Flask 来 说 ， 路 由 函数 的 retum 会 根据 用 户 请 求 来 对 用 户 做 


出 响应 处 理 ， 响 应 结果 有 多 种 方式 表示 ， 
件 ， 具 体 的 使 用 方法 如 下 : 
# 响应 内 容 为 字符 串 


Q@app.route('/str') 
def MyStr(): 


其 中 最 为 常用 是 字符 串 、JSON 数据 及 HTML 文 


return "The response is string!" 


# 响应 内 容 为 JSON 
from flask import jsonify 
@app.route('/Json') 
def MyJson(): 
json={ 
"response': "Json' 
} 
return jsonify (json) 
# 等 价 于 


# return jsonify (response='Json 


# 响应 内 容 为 HTML 文件 


可 


from flask import render template 
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@app.route('/html') 
def MyHtml () : 
name = "Python Elask' 


return render template(" index.html', name=name) 


上 述 代码 演示 了 如 何 将 不 同 数 据 类 型 的 响应 内 容 返 回 到 浏览 器 上 。 其 中 以 字符 串 返 区 
最 为 简单 ， 直 接 在 retum 后 面 加 入 字符 串 内 容 即 可 。 若 以 JSON 格式 返回 ， 需 要 使 用 Flask 
的 jsonify0 方 法 ， 并 且 返 回 的 数据 必须 以 字典 或 “ 键 = 值 ”的 形式 表示 。 

车 返回 HTML 文件 ， 需 要 使 用 Flask 的 render template() 方 法 实现 。render_template() 
有 一 个 必 选 参数 和 可 选 参数 ， 必 选 参数 的 参数 值 以 字符 串 表 示 ， 代 表 HTML 文件 名 ， 而 
Flask 对 于 HTML 文件 路 径 则 有 固定 的 设置 ，HTML 文件 必须 存放 在 一 个 名 为 templates 的 
文件 夹 里 ， 并 且 该 文件 夹 必须 与 Flask 的 运行 文件 放 在 同一 目录 ， 如 图 14-5 所 示 。 


图 14-5 目录 结构 


render templateO) 的 可 选 参数 是 对 HTML 文件 里 的 变量 进行 赋值 ， 然 后 这 些 变量 的 变量 
值 就 会 展示 在 浏览 器 中 ， 这 个 展示 过 程 是 由 Flask 的 依赖 外 部 库 一 一 Jinja2 模板 引擎 实现 
的 。 模 版 引擎 有 自身 的 模版 语法 ， 语 法 规则 与 Python 语法 十 分 相似 ， 但 它 只 能 编写 在 
HTML 文件 里 。 

比如 路 由 函数 MyHtml 是 将 变量 name 的 变量 值 传递 到 模版 ndex.html 的 变量 name， 然 
后 Jinja2 模板 引擎 将 变量 值 进行 转换 ， 生 成 相应 的 HIML 代码 并 显示 在 浏览 器 上 ， 如 图 14-6 
所 示 。 


品 
口 127.00.15 x 口 127.0.0.1:55 x D 127.0.0.1:500” x 


€ 3 GC |®12700.1:5000/str 女 | € 3 GC |® 127.00.1:5000/Json 女 | € > G {© 127.00.1:5000/html 


The response is string! { My name is Python Flask 
“respanse”: “Json” 


The response is HTML's file ! 
图 14-6 运行 结果 


Jinja2 的 语法 特性 就 不 再 做 详细 介绍 ， 有 兴趣 的 读者 可 查看 (http://jinja.pocoo.org/ 
docs/2.10/) 官方 文档 了 解 更 多 。 
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Flask 的 设计 易于 使 用 和 扩展 ， 依 赖 于 两 个 外 部 库 : Jinja2 模板 引擎 和 Werkzeug WSGI 
工具 包 。 它 的 初 庙 是 为 各 种 复杂 的 Web 应 用 程序 构建 坚实 的 基础 ，Python Web 开发 人 员 可 
以 自由 地 插入 任何 扩展 ， 也 可 以 自由 构建 自己 的 模块 ， 具有 很 强 的 扩展 性 。Flask 具有 开 箱 
即 用 的 优点 ， 并 有 以 下 的 特点 : 


(1) 内 置 开发 服务 器 和 快速 调试 器 。 
(2) 集成 支持 单元 测试 。 

(3) RESTful 可 请 求 调度 。 

(4) Jinja2 模板 。 

(5) 支持 安全 cookie (客户 端 会 话 ) 。 
(6) 符合 WSGI 1.0。 

(7) 基于 Unicode。 


一 个 简单 的 网 站 系统 由 三 部 分 组 成 : Flask 实例 化 、 定 义 网 站 的 路 由 地 址 和 函数 、 网 站 
的 运行 入 口 。 三 者 的 说 明 如 下 。 


e@ Flask 实 例 化 : 这 是 通过 Python 的 Flask 模 块 实例 化 ， 因 为 Python 是 面向 对 象 编 程 语言 ， 
而 实例 化 是 创建 一 个 Flask 对 象 ， 它 代表 整个 网 站 系统 。 

@ 定义 网 站 的 路 由 地 址 和 函数 : 网 站 路 由 是 由 Flask 对 象 app 的 route 装 饰 器 定义 ， 它 对 网 站 
系统 添加 网 站 地 址 。 每 个 网 站 地 址 都 有 一 个 路 由 函数 处 理 ， 这 个 函数 是 用 于 响应 用 户 
的 请 求 ， 比 如 用 户 在 浏览 器 上 访问 这 个 网 址 ， 那 么 网 站 系统 必须 对 用 户 的 HITP 请 求 做 
出 响应 ， 这 个 响应 过 程 就 是 由 这 个 路 由 函数 处 理 和 实现 的 。 

@ 网 站 的 运行 入 口 : 用 于 启动 并 运行 网 站 ， 由 app 对 象 的 run() 方 法 实现 。run() 方 法 里 可 以 
设置 相应 的 参数 来 设置 网 站 的 运行 方式 。 


路 由 地 址 是 以 “/” 表 示 的 ， 而 在 浏览 器 中 却 变 成 了 http://127.0.0.1:5000/。 因 为 路 由 地 
址 第 一 个 “/” 表 示 网 站 的 域名 或 他 地 址 ， 也 就 是 我 们 常 说 的 网 站 首页 。 网 站 的 路 由 地 址 编 
写 规则 与 Windows 的 文件 目录 路 径 是 相似 的 ， 每 个 “/” 代 表 不 同 的 路 由 等 级 ， 每 个 路 由 等 
级 的 命名 可 以 是 固定 的 或 以 变量 表示 。 
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GET 请 求 参数 是 附加 在 路 由 地 址 并 以 “? ”表示 的 ，“? ”后 面 的 信息 是 请 求 参数 ， 


每 个 参数 以 A=B 的 形式 表示 ，A 是 参数 名 ，B 是 参数 值 ， 如果 有 多 个 


之 间 以 “&&” 隔 开 。 
POST 请 求 参数 以 JSON 格式 表示 ， 它 不 会 附加 在 路 由 地 址 上 ， 


候 ， 它 会 随 着 路 由 地 址 一 并 发 送 到 网 站 系统 。 


当 浏 览 器 收 到 处 理 结果 (也 称 为 响应 内 容 ) 后 ， 会 根据 响应 内 容 生成 相 


请 求 参数 ， 每 个 参数 


因为 路 


地 址 的 内 容 长 


度 是 有 限制 的 ， 而 POST 的 请 求 参数 往往 会 超出 路 由 地 址 的 限制 。 在 发 送 P 


OST 请 求 的 时 


应 的 网 页 给 用 


户 浏 览 。 网 站 将 处 理 结果 返回 到 用 户 这 一 过 程 ， 我 们 称 之 为 响应 过 程 。 对 于 Flask 来 说 ， 路 


最 为 常用 是 字符 串 、JSON 数据 及 HTML 文件。 


由 函数 的 retum 是 根据 用 户 请 求 来 对 用 户 做 出 响应 处 理 ， 响 应 结果 有 多 种 方式 表示 ， 其 中 


自动 化 系统 的 开发 与 部 署 


本 章 讲述 两 个 Web 系统 的 实现 : 任务 调度 系统 和 任务 执行 系统 ， 两 者 都 是 由 Flask 框 
架 实 现 ， 并 且 存 在 紧密 的 关联 。 比 如 在 一 个 局 域 网 内 ， 任 务 调 度 系统 只 能 部 署 在 某 一 台 计 
算 机 上 ， 任 务 执行 系统 则 可 以 部 署 在 一 台 或 多 台 计 算 机 上 ， 调 度 系统 记录 了 执行 系统 的 人 P 
地 址 ， 通 过 接口 API 的 方式 向 执行 系统 发 起 任务 请 求 ， 当 执行 系统 接收 到 任务 请 求 就 会 执 
行 相应 的 自动 化 程序 ， 从 而 实现 自动 化 程序 可 视 化 管理 。 


15.1 系统 设计 概述 


当 自 动 化 程序 的 数量 达到 一 定量 的 时 候 ， 在 管理 和 维护 上 会 出 现 各 种 各 样 的 问题 ， 比 
如 程序 运行 条 件 、 环 境 配置 等 ， 为 了 更 好 地 解决 这 一 问题 ， 我 们 需要 开发 一 个 管理 系统 来 
管理 和 控制 这 些 自动 化 程序 。 这 个 管理 系统 不 仅 用 来 记录 自动 化 程序 的 基本 信息 ， 还 可 以 
控制 自动 化 程序 的 运行 ， 具 体 的 控制 原理 如 图 15-1 所 示 。 

从 原理 图 可 以 看 出 ， 在 同一 个 局 域 网 内 ， 有 一 台 计 算 机 负责 任务 调度 ， 它 不 仅 用 于 记 
录 自 动 化 程序 的 基本 信息 ， 而 且 还 能 通过 HTTP 协议 发 送 请 求 到 任务 执行 的 计算 机 ， 完 整 
的 任务 调度 流程 说 明 如 下 : 
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任务 调度 中 心 


HTTP 协 议 


3 


任务 执行 A 任务 执行 B 任务 执行 C 任务 执行 D 


图 15-1 自动 化 程序 控制 原理 


(1) 当 任务 执行 系统 收 到 任务 调度 中 心 的 任务 请 求 后 ， 任 务 执行 系统 就 会 启动 并 运行 


本 地 的 自如 


(2) 任务 调度 


送 多 个 任务 


化 程序 。 


请 求 。 


3 


动 化 程序 运行 完毕 后 ， 任 务 执行 系统 将 运行 结果 发 送 到 任务 调度 中 心 。 


(4) 任务 调度 中 心 收 到 运行 结果 后 ， 将 结果 记录 在 数据 库 并 释放 任务 锁 。 


在 整个 
统 ， 两 者 负 
端 ， 两 个 系 


bh 心 发 送 任 务 请 求 后 会 生成 一 个 任务 锁 ， 该 锁 禁止 任务 调度 中 心 同时 发 


的 任务 调度 流程 中 发 现 ， 任 务 调度 中 心 和 任务 执行 系统 是 两 个 不 同 的 Web 系 


责 实现 不 同 的 功能 。 我 们 将 任务 调度 中 心 称 为 服务 端 ， 任 务 执行 系统 称 为 客户 


统 的 功能 说 明 大 致 如 下 : 


服务 端 保存 了 自动 化 程序 的 基本 信息 和 程序 执行 记录 ， 这 些 数据 将 保存 在 MySQL 数 


据 库 里 ， 程 序 信息 和 程序 执行 记录 存放 在 两 个 不 同 的 数据 表 ， 而 数据 表 的 展示 由 系统 
Admin 后 台 实 现 ， 它 为 数据 表 提 供 了 增删 改 查 操作 。 程 序 信息 表 的 展示 效果 图 如 图 15 


所 示 。 


图 15-2 上 是 程序 信息 表 的 数据 生成 的 HIML 网 页 ， 网 页 中 提供 了 数据 创建 、 数 据 


除 、 批 量 删 


的 
9 


除 、 数 据 修改 以 及 执行 任务 等 功能 。 执 行 任务 是 自 定义 的 功能 ， 它 可 以 批量 对 


不 同 的 客户 端 发 送 任务 执行 请 求 。 程 序 执行 记录 表 与 程序 信息 表 的 结构 形式 相似 ， 如 


15-3 所 示 。 


并 


图 
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动 化 管理 系统 。 首页 


图 15-2 程序 信息 表 


总 的 来 说 ， 服 务 端 主要 是 实现 一 个 后 台 管 理 系统 ， 负 责 管理 局 域 网 内 不 同 计算 机 里 面 
动 化 程序 以 及 调度 和 控制 程序 的 运行 。 


动 化 管理 系统 。 首页 。 自动 化 程序 信息 表 | 自动 化 程序 记录 表 


IP ”删除 称 Status 创建 时 间 
和 曾 192.168.1.10 mytest 2018-09-26 16:41:12 
曾 192.168.1.10 mytest done 2018-09-26 16:47:39 


图 15-3 程序 执行 记录 表 
客户 端 则 负责 接收 任务 请 求 ， 当 收 到 调度 中 心 的 任务 请 求 时 ， 客 户 端 就 开启 异步 任 
异步 任务 利用 多 线程 的 技术 来 实现 。 
因为 客户 端 收 到 任务 请 求 后 ， 必 须要 对 调度 中 心 做 出 HTTP 响应 ， 这 是 一 个 完整 的 


t 


HTTP 请求 过 程 ， 同 时 客户 端 还 要 执行 自动 化 程序 ， 如 果 将 HTTP 响应 和 执行 自动 化 程序 同 
步 执行 ， 那 么 HITP 响应 必须 要 等 待 自动 化 程序 运行 完成 后 才能 执行 ， 这 就 造成 了 一 个 很 
长 的 等 待 时 间 ， 从 而 影响 调度 中 心 的 其 他 操作 。 


所 以 客户 端 将 HITP 响应 和 自动 化 程序 的 运行 分 别 单独 处 理 ， 当 客户 端 收 到 任务 请 求 


后 ， 


马上 开启 异步 任务 执行 自动 化 程序 并 对 该 请 求 做 出 HITP 响应 。 当 自动 化 程序 运行 完 


成 后 就 会 自动 发 送 新 的 HITP 请 求 到 调度 中 心 ， 告 知客 户 端的 任务 已 执行 完成 ， 并 将 释放 
任务 状态 锁 。 整 个 通信 流程 如 图 15-4 所 示 。 
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响应 任务 请 来 


图 15-4 ”通信 流程 图 
15.2 ”搭建 开发 环境 


根据 系统 设计 可 知 ， 整 个 自动 化 系统 由 Python 的 Flask 框架 、MySQL 和 Redis 数据 库 
组 成 。MySQL 数据 库 负责 保存 和 处 理 数据 信息 ; Redis 数据 库 负责 生成 异步 任务 的 数据 信 
息 ， 这 是 异步 任务 的 必 备 的 功能 之 一 ; Python 的 Flask 框 架 用 于 开发 服务 端 (任务 调度 中 心 ) 
和 客户 端 〈 任 务 执行 系统 ) 。 因 此 开发 环境 的 搭建 分 为 三 部 分 : MySQL 数据 库 的 安装 、 
Redis 数据 库 的 安装 和 Flask 框架 的 安装 。 

MySQL 数据 库 安装 包 可 以 在 官方 网 站 (https://dev.mysql.com/downloads/installer/〉 下 
载 ， 本 书 以 MySQL 的 5.7 版 本 为 例 ， 在 官网 下 载 MySQL 5.7.23 的 msi 安装 程序 ， 如 图 15-5 
所 示 。 


MySQL Installer 5.7.23 


Select Version Looking for the latest GA 
3 verslon 


Select Operating System 


Windows (x86, 32-bit), MS Installer 


Windows (x86, 32-bit), MSl Installer 


图 15-5 下 载 MySQL 安装 程序 
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运行 已 下 载 的 msi 安装 程序 并 根据 安装 提示 即 可 完成 数据 库 的 安装 。 如 果 在 安装 过 程 


位 安装 包 ， 不 能 安装 


关 Navicat Premium 


的 资料 ， 软 件 界面 如 


中 出 现 安装 失败 并 提示 缺少 Visual Studio 2013 Redistributable 组 件 ， 需 要 安装 该 组 件 的 32 


64 位 ， 因 为 MySQL 5.7 的 安装 程序 是 32 位 。 

MySQL 数据 库 安 装 成 功 后 ， 我 们 还 需要 安装 数据 库 的 可 视 化 工具 。 以 Navicat 
Premium 12 为 例 ， 它 可 以 支持 多 种 数据 库 的 连接 ， 方 便 我 们 查看 和 管理 数据 库 的 数据 。 有 
12 的 安装 及 使 用 方法 ， 本 书 就 不 再 详细 讲述 ， 读 者 可 以 自行 查阅 相关 


图 15-6 所 示 。 


© Navicat Premium 


图 15-6 Navicat Premium 12 


如 果 使 用 5.7 以 上 的 MySQL 8.0 版 本 ， 在 连接 MySQL 数据 库 时 可 能 会 提示 无 法 连接 的 
洪 误 信息 ， 这 是 因为 MySQL 8.0 版 本 的 密码 加 密 方式 发 生 了 改变 ， 在 8.0 版 本 的 用 户 密码 
采用 的 是 cha2 加 密 方法 。 

为 了 解决 这 个 问题 ， 我 们 通过 SQL 语句 将 8.0 版 本 的 加 密 方法 改 回 原来 的 加 密 方式 ， 
这 样 可 以 解决 连接 MySQL 数据 库 的 错误 问题 。 在 MySQL 的 可 视 化 工具 中 运行 以 下 SQL 


语句 : 


# newpassword 是 我 们 设置 的 用 户 密码 
ALTER USER '‘'root'@'localhost' IDENTIFIED WITH mysql native password BY 


'newpassword'; 


FLUSH PRIVILEGES; 


Windows 安装 Redis 数据 库 有 两 种 方式 : 官网 下 载 压缩 包 安装 和 GitHub 下 载 msi 安装 


程序 。 前 者 的 数据 库 版 本 是 最 新 的 ， 但 需要 通过 指令 安装 并 


设置 相关 的 环境 配置 ， 后 者 是 


旧版 本 ， 但 安装 方法 是 傻瓜 式 安装 ， 启 动 程序 单 击 按钮 即 可 完成 安装 。 两 者 的 下 载 地 址 


如 下 : 
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# 官网 下 载 地 址 
https://redis.io/download 
# github 下 载 地 址 


https://github.com/MicrosoftArchive/redis/releases 


本 书 的 Redis 数据 库 以 GitHub 的 msi 安装 程序 为 例 ， 安 装 过 程 相 对 简单 ， 此 处 就 不 做 
详细 讲述 ， 读 者 如 在 安装 过 程 中 出 现 问题 ， 可 以 自行 查阅 相关 的 资料 。 除 了 安装 Redis 数 
据 库 之 外 ， 还 可 以 安装 Redis 数据 库 的 可 视 化 工具 ， 可 视 化 工具 可 以 帮助 初次 接触 Redis 的 
读者 了 解数 据 库 结构 。 本 书 使 用 Redis Desktop Manager 作 为 Redis 的 可 视 化 工具 ， 如 图 15-7 
所 示 。 


加 连接 到 Redis 服务 器 | 了 se 
reds DmOwQR redis Desktop Nanager x 
uo 


ee. 区 盐 Redis Desktop Manager 


ui; 一 Version 0.9.3.817 Developed by ~ Igor Malinovskiy in Qe Ukraine 


Ou: 人 Report issue @ Docunentation 网 Join Gitter Chat 四 Follow 图 star! 


us sod third party softvare nd inagee: 的 ORedisCliont, Google Broakped, 1cons from iconsd. cea Nedis Logo 
us 
时 db 
is 
us 
Hiio 
hll 


ii? 29 11:28:43 ; Connecti s > [runconnand] INFO AL 


Many thanks to our amazing Contributors, Supporters and Community 


图 15-7 Redis Desktop Manager 


最 后 安装 Flask 的 功能 组 件 ，Flask 框架 本 身 不 具备 Admin 后 台 以 及 数据 库 操作 等 功 
能 。 因 此 ， 除 了 安装 Flask 框 架 之 外 ， 还 需要 安装 一 系列 的 功能 组 件 。 框 架 和 功能 组 件 的 安 
装 都 可 以 使 用 pip 指令 完成 ， 具 体 的 安装 指令 如 下 所 示 : 


# 安装 admin 后 台 

pip install flask-admin 

# 安装 Flask 的 国际 化 与 本 地 化 
pip install flask-babelex 

# 安装 Flask 的 ORM 框架 

pip install flask-sqlalchemy 
# 安装 Mysql 的 连接 模块 

pip install pymysql 
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安装 Redis 的 连接 模块 
pip install redis 
# 安装 异步 任务 框架 


pip install celery 


上 述 安 装 的 模块 相对 较 多 ， 不 同 的 模块 负责 实现 不 同 的 功能 ， 还 有 些 功 能 需要 以 下 几 
个 模块 共同 实现 ， 具 体 的 说 明 如 下 所 示 。 


e@ flask-admin: 实现 Flask 的 Admin 后 台 管 理 系统 。 

@ flask-babelex: 设置 Flask 的 国际 化 与 本 地 化 ， 也 就 是 设置 系统 的 语言 和 时 间 。 

e@ flask-sqlalchemy: Flask 的 ORM 框 架 ， 通 过 定义 类 来 映射 数据 表 ， 使 数据 表 实 现 面向 对 
象 开 发 。 

e pymysql: 将 Python 与 MySQL 数 据 库 实现 连接 。 

@ redis: 将 Python 与 Redis 数 据 库 实现 连接 。 

@ celery: 异步 任务 框架 ， 用 于 执行 异步 任务 。 


至 此 ， 整 个 自动 化 系统 的 开发 环境 已 经 搭建 完成 。 总 的 来 说 ， 开 发 环境 的 搭建 主要 分 
为 三 个 步骤 安装 MySQL 数据 库 和 MySQL 的 可 视 化 工具 、 安 装 Redis 数据 库 和 Redis 的 
可 视 化 工具 、 安 装 Flask 的 功能 组 件 。 


15.3 ”任务 调度 系统 


在 15.1 节 中 曾 提 及 到 任务 调度 中 心 的 系统 功能 : Admin 后 台 管 理 和 程序 信息 管理 。 根 
据 系 统 的 功能 需求 设计 ， 我 们 将 任务 调度 中 心 的 目录 结构 分 为 admin.py、main.py、 
models.py 和 settings.py， 每 个 文件 所 实现 的 功能 说 明 如 下 。 


。 admin.py: 实现 Admin 后 台 管 理 ， 由 flask-admin 模 块 实现 。 

e main.py: 系统 的 运行 文件 ， 用 于 启动 任务 调度 中 心 的 运行 ; 定义 API 接 口 ， 用 于 接收 
任务 执行 系统 的 程序 运行 结果 。 

e@ models.py: 定义 数据 模型 ， 实 现 Flask 与 MySQL 的 数据 映射 ， 由 flask-sqlalchemy 模 块 

@ settings.py: 网 站 的 配置 文件 ， 将 Flask 与 flask-babelex、flask-admin 和 flask-sqlalchemy 等 
模块 进行 绑 定 ， 使 第 三 方 模块 能 够 应 用 于 Flask 框 架 。 
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整个 任务 调度 中 心 的 网 页 全 都 由 flask-admin 模块 提供 ， 因 此 项 目 结构 中 无 须 使 
HTML 文件 ， 系 统 的 目录 结构 如 图 15-8 所 示 。 
ba server D:\serve 
坊 admin.py 


命 main.py 
命 models.pPy 


合 settings.Py 


图 15-8 系统 目录 结构 


15.3.1 配置 文件 


任务 调度 中 心 的 配置 文件 由 settings.py 实现 ， 系 统 的 配置 主要 是 对 Flask 实例 化 的 app 
对 象 进行 设置 。 该 系统 需要 将 Flask 与 flask-babelex、flask-admin 和 flask-sqlalchemy 等 模块 
进行 绑 定 ， 其 配置 文件 的 配置 信息 如 下 所 示 : 


from flask import Flask 

from flask sqlalchemy import SQLAlchemy 
from flask admin import Admin 

from flask babelex import Babel 


# Flask 实例 化 ， 生 成 对 象 app 
app = Flask( name ) 
# 本 地 化 ， 将 网 页 内 容 改 为 中 文 显示 
babel = Babel (app) 
# 设置 app 的 配置 信息 
URI = 'mysql+pymysql://root:1234@localhost:3306/automation?charset=utf8"' 
app.config.update( 
# 设置 SQLAlchemy 连接 数据 库 
SQLRALCHEMY DATABASE URI=URI, 
# 设置 中 文 
BABEL DEFAULT LOCALE="'zh CN', 
# 设置 密 钥 值 ， 用 于 Session、Cookies 以 及 扩展 模块 
SECRET KEY="'213sd4156s51"' 
# 解决 JSON 乱码 


JSON AS ASCII=False 
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# 将 Flask 与 SQLAlchemy 绑 定 

db = SQLAlchemy (app) 

# 定义 admin 后 台 

# 参数 name 设置 Admin 后 台 的 名 字 

# 参数 template mode 设置 Admin 后 台 的 网 页 样式 

admin = Rdmin (app，name=' 任 务 调度 中 心 '，template mode='bootstrap3') 


代码 中 app 对 象 分 别 绑 定 flask-babelex、flask-sqlalchemy 和 flask-admin， 依 次 生成 
babel、db 及 admin 对象， 这 些 对 象 可 以 直接 调用 这 些 扩展 模块 里 面 的 方法 ， 从 而 实现 相应 
的 功能 。 
比如 db 对 象 ， 它 可 以 调用 flask-sqlalchemy 里 面 的 函数 和 方法 ， 从 而 实现 对 数据 库 的 操 
作 ; admin 对 象 用 于 生成 Admin 后 台 系 统 ， 通 过 操作 admin 对 象 即 可 实现 Admin 后 台 的 自 定 
义 开发 。 
配置 代码 还 对 app 对 象 的 config 属性 进行 更 新 处 理 ， 对 config 属性 额外 添加 了 四 个 属 
性 ， 属 性 说 明 如 下 。 
。 SQLALCHEMY DATABASE URI: 设置 系统 所 连接 的 数据 库 ， 连 接 符 中 的 pymysql 代 
表 SQLAlchemy 使 用 pymysql 模 块 连接 MySQL; root 代 表 数 据 库 的 用 户 名 ; 1234 是 数据 
库 的 密码 ; localhost 和 3306 分 别 代表 数据 库 的 卫 地 址 和 端口 ; automation 是 数据 库 的 命 
名 ; charset 是 数据 库 的 编码 格式 。 
e BABEL DEFAULT LOCALE: 设置 系统 的 显示 语种 ， 默 认为 英语 ， 该 属性 配置 是 基 
于 flask-babelex 模 块 。 
e@ SECRET KEY: 设置 密 钥 值 ， 用 于 Session、Cookies 以 及 扩展 模块 ， 这 是 一 个 比较 重要 
的 配置 值 ， 几 乎 每 个 Web 框 架 都 需要 配置 ， 可 对 一 些 重要 的 数据 进行 加 密 处 理 。 
e JSON AS ASCII: 若 系统 以 JSON 格 式 返回 给 用 户 ， 如 果 JSON 数 据 中 含有 中 文 内 容 ， 
该 属性 可 防止 中 文 乱码 显示 。 


15.3.2 ”数据 模型 


企业 级 开发 都 是 使 用 ORM 框架 来 实现 数据 库 持久 化 操作 的 ， 所 以 作为 一 个 开发 人 
员 ， 很 有 必要 学 习 ORM 框架 ， 常 用 的 ORM 框架 模块 有 SQLObject、Stom、Django 的 
ORM、peewee 和 SQLAlchemy。 

本 节 主 要 讲述 Python 的 ORM 框架 一 一 SQLAlchemy。SQLAlchemy 是 Python 编程 语 
言 下 的 一 款 开源 软件 ， 提 供 SQL 工具 包 及 对 象 关系 映射 工具 ， 使 用 MIT 许可 证 发 行 。 

SQLAlchemy 采用 简单 的 Python 语言 ， 为 高 效 和 高 性 能 的 数据 库 访 问 设 计 ， 实 现 了 完 
整 的 企业 级 持久 模型 。SQLAlchemy 的 理念 是 ，SQL 数据 库 的 量 级 和 性 能 重要 于 对 象 集 


合 ， 而 对 象 集合 的 抽象 又 重要 于 表 和 行 。 因 此 ，SQLAlchmey 采 / 


不 亚 了 


SQLAlchemy 在 构建 于 WSGI 规范 的 下 一 代 Python Web 框架 
Mike Bayer 及 其 开发 团队 开发 的 一 个 单独 的 项 目 。 使 用 SQLAlchemy 等 独立 ORM 的 一 个 优 


势 就 是 允许 开发 人 员 首 先 考虑 数据 模型 ， 并 能 决定 稍 后 可 视 化 数据 的 方式 〈 采 用 


第 15 章 ”自动 化 系统 的 开发 与 部 署 | 247 


类 似 Java 里 Hibernate 的 
数据 映射 模型 ， 而 不 是 其 他 ORM 框架 采用 的 Active Record 模型 。 不 过 ，Elixir 和 
declarative 等 可 选择 件 可 以 让 用 户 使 用 声明 语法 。 


SQLAlchemy 首次 发 行 于 2006 年 2 月 ， 是 Python 社 区 中 被 广泛 使 用 的 ORM 工具 之 一 ， 
F Django 的 ORM 框架 。 


ph 得 到 了 广泛 应 用 ， 是 由 


命令 行 工 


具 、Web 框架 还 是 GUI 框架 ) 。 这 与 先决 定 使 用 Web 框架 或 GUI 框架 ， 再 决定 如 何在 框 
架 人 允许 的 范围 内 使 用 数据 模型 的 开发 方法 极为 不 同 。 
SQLAlchemy 的 一 个 目标 是 提供 能 兼容 众多 数据 库 (如 SQLite、MySQL、Postgres、 


Oracle、MS-SQL、SQLServer 和 Firebird) 的 企业 级 持久 性 模型 。 
对 于 Flask 来 说 ， 它 的 ORM 框架 是 在 SQLAIlchemy 框架 上 进行 封装 ， 使 之 更 符合 Flask 
的 开发 。 


任务 调度 中 心 的 models.py 文 件 是 定义 数据 模型 ， 模 型 是 以 类 的 形式 表示 ， 通 过 对 类 的 
使 用 来 实现 ， 从 而 实现 数据 库 的 操作 。models.py 的 数据 模型 定义 如 下 : 


from settings import * 
# 定义 自动 化 程序 信息 表 
class ProgramInfo (db.Model) : 


# db.Column 是 定义 字段 、db .INT 是 字段 的 数据 类 型 

_ tablename ”= "ProgramInfo" 

id = db.Column (db.INT, primary key=True) 
clientIP = db.Column (db.string (50)) 
introduce = db.Column (db.string(50)) 

name = db.Column (db.string(50), unique=True) 
statusLock = db.Column (db.string(50)) 


# 定义 任务 记录 表 
class TaskRecord(db.Model): 


# db.Column 是 定义 字段 、db.INT 是 字段 的 数据 类 型 
_ tablename = 'TaskRecord' 

id = db.Column (db.INT, primary key=True) 
clientIP = db.Column (db.string(50)) 

name = db.Column (db.string(50)) 

status = db.Column (db.String(50) ) 


createTime = db.Column (db.DateTime, server default=db.func.now()) 
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# 创建 数据 表 
db.create all() 


首先 从 配置 文件 settings.py 导入 已 定义 的 对 象 ， 如 babel、db 及 admin 对 象 ， 尽 管 
models.py 不 需要 使 用 babel 和 admin 对 象 ， 但 我 们 依然 将 整个 配置 文件 导入 ， 因 为 这 样 可 
以 解决 系统 运行 所 依赖 的 对 象 ， 具 体 的 内 容 会 在 后 续 讲述 ， 对 于 modelspy 的 代码 说 明 


如 下 : 


(1) 代码 中 分 别 定 义 了 数据 模型 ProgramInfo 和 TaskRecord， 它 们 继承 db.Model 类 ， 
而 父 类 db.Model 由 SQLAlchemy 定义 ， 其 作用 是 将 SQLAlchemy 与 数据 库 实现 映射 关系 。 
(2) 类 属性 _tablename ”是 设置 数据 表 的 表 名 ， 因 为 数据 库 的 数据 表 可 以 通过 数据 模 


型 生成 。 

(3) 数据 表 字 段 由 db.Column 定义 ， 而 字段 的 数据 类 型 由 db.INT、 
db.DateTime 设置 。 

(4) 最 后 使 用 db.create al0， 根 据 数据 模型 的 定义 ， 从 而 在 数据 库 j 


db.String(50) 及 


据 表 。 


P 生 成 相应 的 数 


SQLAlchemy 对 不 同 数据 类 型 的 表 字 段 有 不 同 的 定义 方式 ， 由 于 篇 幅 有 限 ， 我 们 只 列 


出 SQLAlchemy 常用 的 数据 类 型 ， 如 表 15-1 所 示 。 
表 15-1 SQLAIchemy 常用 的 数据 类 型 


SQLAlchemy 数据 类 型 Python 数据 类 型 说 明 
Integer Int 整 型 

String Str 字符 串 
Float Float 浮 点 型 
DECIMAL decimal.Decimal 定点 型 
Boolean Bool 布尔 型 
Date datetime.date 日 期 
DateTime datetime.datetime 日 期 和 时 间 
Time datetime.time 时 间 

Text Str 文本 类 型 
LongText Str 长 文本 类 型 


在 代码 中 还 看 到 字段 id 设置 了 列 选 项 primary_key， 这 是 将 字段 设 为 数据 表 的 主键 。 


SQLAlchemy 的 常用 列 选项 如 表 5-2 所 示 。 
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表 15-2 SQLAIchemy 的 常用 列 选项 


列 选项 说 明 

primary_key 如 果 为 Tme， 设 置 字段 为 表 的 主键 

unique 如 果 为 Trme， 设 置 字段 的 唯一 性 

index 如 果 为 True， 对 字段 创建 索引 ， 提 高 查询 效率 

nullable 如 果 为 Tme， 字 段 允 许 为 室 ， 如 果 为 False， 字 段 不 允许 为 空 
default 定义 默认 值 


server default 


定义 默认 值 


现在 已 定义 了 数据 模型 ProgramInfo 和 TaskRecord， 接 下 来 讲述 如 何 使 用 数据 模型 实现 
数据 表 的 操作 。 数 据 表 的 操作 主要 有 增删 改 查 ，SQLAlchemy 对 不 同 的 操作 有 不 同 的 使 用 
方式 ， 此 处 列 出 一 些 较为 常用 的 操作 方式 ， 在 models.py 里 添加 以 下 代码 : 


Ee 


name ==' main ': 


插入 数据 


= ProgramInfo () 


# 
p 
pP.clientIP = 'localhost' 
pP.introduce = 'MySQLAlchemy' 

P.name = 'SQLAlchemy' 

p.statusLock = "" 

db.session.add (p) 

db.session.commit () 

# 更 新 数据 

name = 'SQLAlchemy' 

qs = ProgramIinfo.query.filter by (name=name) 

qs.update ({ProgramInfo.introduce: 'YourSsQLAlchemy'}) 
# 查询 数据 

# 查询 全 表 

print (ProgramInfo.query.all ()) 

# 条 件 查 询 ，filter_by 用 来 设置 查询 条 件 

print (ProgramInfo.query.filter by (name='SQLAlchemy')) 
# 查询 字段 name，query (ProgramInfo.name) 设置 只 查询 的 字段 
print (db.session.query (ProgramIinfo.name) .all ()) 

# 删除 某 条 数据 

name = "SQLALchemy" 

qs = ProgramInfo.query.filter by (name=name) .first () 
db.session.delete (qs) 


db.session.commit () 
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新 添加 的 代码 演示 了 SQLAlchemy 对 数据 表 的 增删 改 查 操作 ， 在 PyCharm 里 打开 系统 
的 目录 ， 并 单独 运行 models.py 文 件 ， 运 行 结果 中 会 出 现 一 些 红 色 的 提示 信息 ， 这 个 提示 信 
息 并 不 影响 程序 的 运行 ， 结 果 如 图 15-9 所 示 。 


Iv Mserver D:\server 


篇 admin.py 26 Pb if _name_ =—’"_ main “”: 


nu | 


p = ProgramInfo() 


p. clientIP = ' localhost’” 
p. introduce = ' MySQLAlchemy’ 
if_name_ -=-”，main ， 


result = self, _query (query) 
[<ProgramInfo 2>] 
[<ProgramInfo 2>] 
[4 SQLAlcheny ,)] 


图 15-9 运行 结果 
对 于 SQLAlchemy 来 说 ， 同 一 种 数据 库 操作 可 能 有 多 种 不 同 的 方法 实现 。 上 述 代码 只 
是 列 出 了 常用 的 操作 方式 ， 这 也 是 SQLAlchemy 对 数据 表 的 基础 操作 方式 。 读 者 如 想 深 入 
了 解 SQLAlchemy， 可 以 到 官方 网 站 查阅 相关 文档 (https://docs.sqlalchemy.org/en/latest/》。 


15.3.3 Admin 后 台 


Admin 后 台 是 每 个 网 站 都 必须 具备 的 功能 之 一 ， 它 主要 用 于 对 网 页 的 信息 管理 ， 如 文 
字 、 图 片 、 影 音 和 其 他 日 常 使 用 文件 的 发 布 、 更 新 、 删 除 等 操作 ， 简 单 来 说 就 是 对 网 站 的 
数据 库 或 文件 的 快速 操作 管理 系统 ， 以 使 得 网 站 内 容 能 够 得 到 及 时 地 更 新 和 调整 。 

在 models.py 里 分 别 定义 了 数据 模型 ProgramInfo 和 TaskRecord， 而 任务 调度 中 心 的 
admin.py 文件 是 对 这 两 个 数据 模型 实现 可 视 化 操作 ， 比 如 在 网 页 上 实现 数据 的 增删 改 查 操 
作 ， 简 单 地 理解 ， 目 录 结 构 的 admin.py 文件 是 对 数据 模型 的 可 视 化 显示 ， 将 数据 表 的 数据 
显示 在 网 页 上 ， 方 便 用 户 的 操作 和 管理 。 

我 们 知道 ， 任 务 调度 中 心 需要 向 任务 执行 系统 发 送 任 务 请 求 ， 并 会 产生 一 个 状态 锁 ， 
以 防止 在 短 时 间 内 对 同一 个 计算 机 多 次 发 送 任务 请 求 ， 这 个 任务 发 送 功能 添加 在 数据 模型 
ProgramInfo 的 Admin 后 台 ， 具 体 的 实现 代码 如 下 : 


from models import * 


from flask admin.contrib.sqla import ModelView 
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from flask admin.actions import action 
import requests 
# 定义 模型 ProgramInfo 的 admin 后 台 
class ProgramInfoAdmin (ModelView) : 
# 将 字段 设置 中 文 内 容 
Column labels = dict (clientIP='IP 地址 '，name=' 名 称 '， 
introduce=' 描 述 '，statusLock=' 状 态 锁 ') 
# page_size 设置 每 页 的 数据 量 
page size = 30 
# 新 增 任务 请 求 功能 
Qaction(' 执 行 任务 '，' 执 行 任务 '，' 确 定 执行 任务 ?' ) 
def action task(self, ids): 
for id in ids: 
info = ProgramInfo.query.filter by(id=id) .first() 
if not info.statusLock: 
ip = info.clientIP 
name = info.name 
# 写 入 任务 记录 表 
data = TaskRecord (clientIP=ip, name=name) 
db.session.add (data) 
# 获取 刚 写 入 数据 的 主键 
db.session.flush() 
# 向 client 端 发 送 任务 请 求 
taskId = str(data.id) 
url = ip+'?name='+name+'&taskId='+taskId 
print (url) 
Er 
r= requests.get (url) 
if r.status code == 200: 
# 设置 任务 状态 锁 
info.statusLock = "Lock'" 
except: pass 
保存 到 数据 库 
db.session.commit () 
# 在 admin 界面 注册 视图 
admin.add view (ProgramIinfoAdmin (ProgramInfo，db.session， 


name=' 程 序 信 息 表 ' ) ) 


# 定义 模型 TaskRecord 的 admin 后 台 
class TaskRecordAdmin (ModelView) : 
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column labels = dict (clientIP='IP 地 址 '，name=' 名 称 '， 
createTime=' 创 建 时 间 ') 
# 在 admin 界面 注册 视图 
admin.add view (TaskRecordAdmin (TaskRecord, db.session, 


name=' 任 务 记录 表 ' ) ) 


首先 导入 modelspy 里 所 有 已 定义 的 对 象 及 模块 ， 代 码 中 所 使 用 的 admin 对 象 来 自 
modelspy， 而 models.py 的 admin 对 象 则 是 来 自 settingspy， 经 过 这 样 的 层 层 递 进 ， 可 以 解 
决 文件 之 间 的 导入 问题 。 此 外 ， 我 们 还 导入 了 flask-admin 的 ModelView 和 action、requests 
模块 ， 具 体 说 明 如 下 。 


@ ModelView: 这 是 flask-admin 所 定义 的 类 ， 用 于 定义 数据 模型 的 Admin 后 台 。 自 定义 的 
Admin 后 台 都 是 以 类 表示 ， 并 且 可 以 继承 父 类 ModelView。 

@ action: 这 是 flask-admin 所 定义 的 装饰 器 ， 可 以 自 定 义 数据 模型 的 操作 功能 。 使 用 action 
装饰 器 添加 任务 发 送 功能 。 

@ requests: 这 是 Python 的 第 三 方 模块 ， 用 于 发 送 HTTP 请 求 ， 向 任务 执行 系统 发 送 任务 


上 述 代码 分 别 定义 了 ProgramInfoAdmin 和 TaskRecordAdmin 类 ， 分 别 对 应 数据 模型 
ProgramInfo 和 TaskRecord。 其 中 我 们 对 ProgramInfoAdmin 类 设置 了 自 定义 功能 ， 如 设置 字 
段 的 中 文 内 容 、 每 页 的 数据 量 及 任务 发 送 等 功能 ， 具 体 说 明 如 下 。 


(1) 设置 字段 的 中 文 内 容 : 这 是 由 column labels 属性 设置 ， 该 属性 来 自 父 类 
ModelView。 如 不 设置 该 属性 ， 在 Admin 后 台 就 会 显示 数据 模型 所 定义 的 字段 名 。 

(2) 每 页 的 数据 量 : 由 父 类 ModelView 的 page_size 属性 实现 ， 默 认 值 为 20。 因 为 数 
据 表 可 以 存放 大 量 的 数据 信息 ， 而 Admin 后 台 就 需要 将 这 些 数 据 进行 分 页 显示 。 

(3) 任务 发 送 功能 : 由 action 装饰 器 和 requests 模块 共同 实现 。action 装饰 器 是 将 函 
数 action task 所 实现 的 功能 加 载 到 Admin 后 台 ; requests 模块 是 向 任务 执行 系统 发 送 任务 请 
求 ， 这 是 函数 action task 的 重要 功能 之 一 。 


此 外 ， 函 数 action task 对 数据 模型 TaskRecord 新 增 数据 ， 记 录 本 次 任务 的 执行 信息 并 
修改 任务 信息 的 状态 锁 ， 状 态 锁 是 数据 模型 ProgramInfo 所 定义 的 statusLock 字段 。 读 者 必 
须 理 清 函数 action task 的 实现 逻辑 才能 理解 任务 发 送 的 实现 过 程 。 

最 后 由 admin 对 象 的 add view0 方 法 实现 注册 功能 ， 将 ProgramInfoAdmin 和 
ProgramInfo 进行 绑 定 ， 从 而 生成 相应 的 Admin 后 台 网 页 。 
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Flask 的 flask-admin 组 件 还 提供 了 许多 功能 来 满足 日 常 的 开发 需求 ， 本 和 


就 不 再 一 一 讲 


述 了 ， 有 兴趣 的 读者 可 以 查阅 官方 文档 (https://ask-admin .readthedocs.io/en/latest/〉 及 源码 


内 容 ， 源 码 里 每 个 功能 及 参数 都 有 详细 的 说 明 。 


15.3.4 ”系统 接口 与 运行 


任务 调度 中 心 的 main.py 文 件 是 负责 开启 系统 的 运行 以 及 定义 API 接 口 
执行 系统 的 程序 运行 结果 。 也 就 说 ，main.py 文件 需要 实现 两 个 不 同 的 功能 : 


和 添加 一 个 路 由 地 址 〈 即 API 接口 ) ， 具 体 的 实现 代码 如 下 : 


from admin import * 
from flask import request, jsonify 


# API 接口 ， 用 于 接收 client 的 运行 结果 
# http://127.0.0.1:8080/?taskId=3&name=mytest&status=Done 
@app.route('/') 
def callBack(): 
# 获取 GET 的 请 求 参数 
taskId = request.args.get('taskId', '') 
name = request.args.get ('name', '') 
status = request.args.get('status', '') 
if taskId and name: 


# 在 任务 记录 表 修 改 任务 执行 状态 


， 用 于 接收 任务 


设置 系统 运行 


task = TaskRecord.query.filter by(id=int(taskId)) .first() 


task.status = status 


# 释放 任务 的 状态 锁 


info = ProgramInfo.query.filter by (name=name) .first() 


info.statusLock = "'" 
db.session.commit () 

# 返回 响应 内 容 

response = {"result": "success"} 
return jsonify(response) 


else: 
# 返回 响应 内 容 
response = {"result": "fail"} 


return jsonify(response) 
# 网 站 启动 运行 


了 name = " main ': 


app.run (port=8080, debug=True) 
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mainpy 导入 adminpy 所 有 已 定义 的 对 象 和 模块 ，adminpy 的 对 象 和 模块 是 来 自 
modelspy， 而 modelspy 的 对 象 和 模块 来 自 settingspy。 简 单 地 说 ，main py 的 对 象 和 模块 是 
来 自 settings.py， 但 main.py 不 能 直接 导入 settings.py 的 对 象 和 模块 ， 因 为 settings.py 的 对 象 
和 模块 必须 经 过 modelspy 和 admin.py 的 处 理 和 设置 。 读 者 只 要 宏观 地 分 析 整 个 系统 文件 之 
间 的 关系 ， 就 会 发 现 系统 的 设计 要 点 。 

上 述 代码 中 ， 我 们 设置 了 网 站 首页 ， 首 页 的 路 由 函数 callBack 是 接收 任务 执行 系统 的 
任务 执行 结果 ， 也 就 说 自动 化 程序 的 运行 结果 。 路 由 函数 callBack 分 别 获 取 GET 的 请 求 参 
数 ， 并 根据 请 求 参 数 分 别 修改 数据 模型 ProgramInfo 和 TaskRecord 的 字段 值 ， 最 后 将 响应 
内 容 返 回 到 任务 执行 系统 。 

在 admin.py 的 函数 action_task 里 ， 任 务 发 送 是 将 任务 记录 表 (数据 模型 TaskRecord) 
的 主键 id 作为 请 求 参数 taskId 并 发 送 到 任务 执行 系统 ， 当 任务 执行 系统 完成 任务 时 ， 它 把 
之 前 接收 的 请 求 参数 taskId 再 次 发 送 到 任务 调度 中 心 ， 当 任务 调度 中 心 的 接口 〈 路 由 地 址 ) 
收 到 HTTP 请 求 时 ， 路 由 函数 callBack 根据 请 求 参数 taskId， 在 任务 记录 表 ( 数 据 模 型 
TaskRecord) 找到 相应 的 数据 ， 将 运行 结果 记录 在 status 字段 。 

同样 的 方法 ，admin.py 的 函数 action_task 也 将 程序 信息 表 (数据 模型 ProgramInfo) 的 
字段 name 作为 请 求 参数 并 发 送 到 任务 执行 系统 ， 当 任务 执行 系统 完成 任务 时 ， 它 把 之 前 接 
收 的 请 求 参数 name 再 次 发 送 到 任务 调度 中 心 ， 路 由 函数 根据 请 求 参数 name 在 程序 信息 表 
(数据 模型 ProgramInfo ) 找到 相应 的 数据 并 修改 状态 锁 〈 字 段 statusLock) 。 字 段 name 作 
为 数据 模型 ProgramInfo 的 查询 条 件 ， 因 为 在 定义 字段 name 的 时 候 ， 已 经 将 字段 name 设 
为 唯一 性 。 任 务 调 度 中 心 与 任务 执行 系统 之 间 的 数据 传递 如 图 15-10 所 示 。 


汪 务 疯 如 P 心 ( 服务 过 ) 七 务 执行 孙 统 ! 富 户 测 ) 


请 求 参 效 ta 未 [d_name、sbabus 
发 谤 任务 结 蛋 


图 15-10 系统 之 间 的 数据 传递 
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程序 运行 由 Flask 的 run 方法 实现 ， 参 数 port 用 于 设置 系统 运行 的 端口 ， 参 数 debug 

于 设置 系统 为 调试 模式 ， 调 试 模式 是 方便 开发 者 调试 系统 功能 ， 它 会 根据 代码 的 变更 来 决 

是 否 重启 系统 。 

至 此 ， 整 个 任务 调度 中 心 的 开发 已 经 完成 。 我 们 在 PyCharm 里 运行 main.py 文件 即 可 

运行 任务 调度 系统 ， 在 浏览 器 上 分 别 访问 以 下 的 路 由 地 址 ， 验 证 功能 是 否 正常 ， 如 图 
15-11 所 示 。 


D2700 ta080 


IG | © 127.00.1.808 


API 接 口 ， 接 收 任务 执行 系统 的 任务 结果 


可 序 位 大。 本 务 记录 表 


任务 记录 表 


程序 信 息 要 


自动 化 程序 信息 表 


她 址 搞 过 名 了 6 刷 


图 15-11 任务 调度 中 心 


15.4 ”任务 执行 系统 


任务 执行 系统 的 功能 主要 是 根据 任务 请 求 来 执行 相应 的 自动 化 程序 ， 然 后 将 程序 的 运 
行 结 果 发 送 到 任务 调度 中 心 。 整 个 系统 主要 以 程序 执行 为 主 ， 而 程序 执行 是 由 异步 框架 
celery 实现 的 ， 它 可 以 独立 于 系统 而 单独 运行 ， 程 序 执行 所 需 的 时 间 不 会 影响 系统 的 响应 
时 间 。 系 统 目录 结构 分 为 main py、settingspy、taskImnfo py 和 trainTicketpy， 各 个 文件 所 实 
现 的 功能 说 明 如 下 。 

。 main.py: 系统 的 运行 文件 ， 用 于 启动 任务 执行 系统 的 运行 ; 定义 API 接 口 ， 用 于 接收 

任务 调度 中 心 的 任务 执行 请 求 。 

e@ settings.py: 网 站 的 配置 文件 ， 将 Flask 与 celery 和 Redis 进 行 绑 定 ， 也 就 是 将 Flask 与 异步 

任务 框架 celery 绑 定 。 
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@ taskInfo.py: 定义 异步 任务 框架 的 任务 ， 即 自动 化 程序 ， 由 celery 模 块 实现 。 
e@ trainTicketpy: 文件 代码 来 自 第 9 章 的 实战 项 目 ， 实 现 12306 车 次 查询 功能 ， 它 主要 被 系 
统 的 异步 任务 调用 。 
任务 执行 系统 无 须 使 用 HIML 页 面 ， 因 为 它 只 接收 任务 请 求 和 执行 相应 的 自动 化 程 
序 ， 整 个 过 程 都 是 由 系统 自行 完成 ， 系 统 的 目录 结构 如 图 15-12 所 示 。 


v client Di\client 
全 main.py 


Ssettings.py 
Stasklnfo.py 
trainTicket.py 


图 15-12 系统 目录 结构 


15.4.1 配置 文件 


任务 执行 系统 的 配置 文件 由 settings.py 实现 ， 主 要 是 对 Flask 实例 化 的 app 对 象 进行 设 
置 。 它 需要 将 Flask 与 celery 框架 进行 绑 定 ， 配 置 文件 的 配置 信息 如 下 所 示 : 


from flask import Flask 
from celery import Celery 
# 使 用 函数 定义 Celery 对 象 
def make celery (app) : 
celery = Celery( 
app.import name, 
backend=app.config['CELERY RESULT BACKEND'], 
broker=app.config['CELERY BROKER URL'] 
) 
celery.conf.update (app.config) 
class ContextTask (celery.Task): 
def call (olf args, kwargs): 
with app.app_context (): 
return self.run(*args, **kwargs) 
celery.Task = ContextTask 
return celery 


# Flask 实例 化 ， 生 成 对 象 app 
app = Flask( name ) 


# 设置 app 的 配置 信息 
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app.config.update( 
CELERY BROKER URL="'redis://localhost:6379/0", 
CELERY RESULT BACKEND="'redis://localhost:6379/1', 
JSON AS ASCII=False 

) 

# 将 Flask 与 Celery 绑 定 

celery = make celery (app) 


上 述 代码 中 分 别 导 入 Flask 模块 和 celery 模块 ， 代 表 了 Flask 框架 和 celery 框架 ， 
自 定义 函数 make_celery， 函 数 参数 app 是 代表 Flask 实例 化 的 app 对 象 ， 函 数 将 app 对 
celery 框架 进行 绑 定 ， 代 码 由 Flask 的 官方 文档 提供 ， 可 在 http://flask.pocoo.org/doc: 
patterns/celery/ 查 阅 。 
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然后 
| 象 与 
s/1.0/ 


定义 相关 函数 后 ， 接 下 来 是 对 函数 的 调用 以 及 对 Flask 的 实例 化 。Flask 实例 化 对 


app，app 对 象 的 config 属性 设置 了 Redis 数据 库 的 地 址 和 JSON 的 数据 格式 。 异 步 任务 
celery 必须 要 结合 Redis 数据 库 才 能 运行 ， 这 是 celery 的 底层 设计 原理 。 最 后 ， 调 用 自 定义 函 
数 make_celery， 并 将 实例 化 对 象 app 作为 函数 参数 传 入 函数 里 ， 这 样 即 可 实现 Flask 和 celery 


15.4.2 异步 任务 
在 配置 文件 中 ， 任 务 执行 系统 已 绑 定 异步 任务 框架 celery。 在 本 节 中 ， 我 


们 在 


taskInfo.py 里 编写 具体 的 异步 任务 函数 。 当 任务 执行 系统 收 到 任务 请 求 时 ， 系 统 通过 celery 
框架 来 触发 异步 任务 函数 ， 也 就 是 说 ， 异 步 任务 函数 是 用 于 执行 并 调用 自动 化 程序 的 。 


taskInfo.py 的 代码 如 下 所 示 : 


from settings import * 

from trainTicket import * 

import requests 

# 定义 并 注册 异步 任务 

@celery.task() 

def AutoTask (taskId, name, **kwargs): 


try: 
if name == 'printPDF': 
Print('" PrintPDE') 
elif name == "trainTicket' : 


train date = kwargs['train date'] 
from station = kwargs['from station'] 


to_station = kwargs['to station'] 
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i=get info(train date,from station,to station) 
print (str (i)) 
status = "Done” 
except Exception as e: 
print (e) 
status = "Fail' 
# 将 运行 结果 返回 到 任务 调度 中 心 
url = "http://127.0.0.1:8080/?name=' + name + \ 
"&taskId=" + str(taskId) + "&status=" + status 
1 本 
requests.get (url) 
except:pass 
# 返回 任务 状态 


return status 


taskInfo.py 文件 首先 导入 系统 配置 文件 settings.py， 系 统 的 文件 导入 设计 也 是 按照 任务 
调度 中 心 的 设计 原理 。 此 外 ，taskInfo.py 还 导入 了 trainTicket.py 文件 ， 因 为 函数 AutoTask 


并 执行 自动 化 程序 。 


在 函数 AutoTask 里 ， 分 别 定 义 函 数 参数 taskId、name 和 **kwargs， 三 个 函数 参数 的 说 


明 如 下 。 


taskId: 代表 任务 记录 表 (数据 模型 TaskRecord ) 的 主键 ii， 它 来 自任 务 请 求 的 请 求 参 


数 ， 由 任务 调度 中 心 向 任务 执行 系统 发 送 的 HTTP 请 求 。 


name: 代表 程序 信息 表 (数据 模型 ProgramInfo ) 的 字段 name， 它 的 来 源 与 参数 taskId 


2 


##kwargs: 这 是 可 选 参数 ， 如 果 自 动 化 程序 需要 使 用 某 些 配置 ， 


置 ， 通 过 参数 传递 来 配置 自动 化 程序 。 


可 对 该 参数 进行 设 


函数 AutoTask 的 实现 逻辑 分 为 三 部 分 ,根据 参数 name 来 选择 相应 的 自动 化 程序 、 将 
运行 结果 以 HITP 请 求 发 送 到 任务 调度 中 心 、 返 回 任务 状态 。 具 体 说 明 如 下 : 


(1) 根 据 参 数 name 来 选择 相应 的 自动 化 程序 : 参数 name 来 自任 务 调度 中 心 的 程序 信 


息 表 (数据 模型 ProgramInfo) 的 字段 naame， 该 字段 具有 唯一 性 ， 可 以 


月 确 决 定 执行 哪 一 个 


自动 化 程序 。 上 述 代 码 中 ， 当 参数 name 等 于 trainTicket 的 时 候 ， 将 会 调用 trainTicketpy 的 
函数 get info， 该 函数 执行 12306 的 车 次 查询 。 

(2) 将 运行 结果 以 HITP 请 求 发 送 到 任务 调度 中 心 : 该 功能 是 让 任务 调度 中 心 记 录 自 
动 化 程序 的 运行 结果 并 释放 状态 锁 ， 代 码 中 的 变量 url 是 任务 调度 中 心 的 main py 文件 所 定 


义 的 路 


地 址 。 
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(3) 返回 任务 状态 : 运行 结果 显示 在 任务 执行 系统 的 celery 框架 ， 也 可 以 用 于 查看 任 
务 的 运行 结果 。 
从 taskInfo.py 所 实现 的 功能 可 以 看 到 ， 函 数 AutoTask 所 使 用 的 数据 主要 来 自任 务 调 度 
中 心 ， 并 且 还 将 运行 结果 以 HTTP 请 求 发 送 到 任务 调度 中 心 。 


15.4.3 ”系统 接口 与 运行 

任务 执行 系统 的 main.py 文 件 负责 开启 系统 的 运行 以 及 定义 API 接 口 ， 它 与 任务 调度 中 
心 的 mainpy 所 实现 的 功能 是 一 致 的 ， 主 要 是 设置 系统 运行 和 添加 一 个 路 由 地 址 ( 即 API 
接口 ) 。 具 体 的 代码 如 下 : 


from flask import request, jsonify 
from taskInfo import * 


# API 接口 ， 接 收 任务 请 求 
# http://127.0.0.1:8000/?name=trainTicket&taskId=1 
@app.route('/') 
def task receive () : 
taskId = request.args.get('taskId', '') 


name = request.args.get('name', '') 
kwargs = {} 

kwargs['train date'] = '2018-10-29' 
kwargs['from station'] = He 
kwargs['to station'] = ' 武 汉 ' 


AutoTask.delay (taskId, name, **kwargs) 
return jsonify({"result": "success", 
"taskid": CaskIld;}) 


# 先 启动 celery， 在 Pycharm 的 Terminal 输入 以 下 指令 : 
# celery -A taskInfo.celery worker -1 info -P solo 
# 再 启动 运行 网 站 


这 name == " main ': 


app.run (port=8000, debug=True) 


上 述 代 码 导入 了 taskInfo.py 文件 ， 以 获取 taskInfo.py 文件 的 所 有 对 象 和 模块 ， 而 
taskInfo.py 文件 的 对 象 和 模块 有 大 部 分 都 是 来 自 settings.py， 通 过 层 层 的 导入 来 实现 文件 之 
间 的 递 进 关系 。 此 外 ， 我 们 还 导入 了 Flask 的 request 和 jsonify 功能 ， 前 者 用 于 获取 请 求 参 
数 ， 后 者 将 字典 的 数据 格式 转换 成 JSON 格式 。 
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main.py 文件 定义 了 系统 首页 的 路 由 地 址 以 及 路 由 函数 task receive， 这 是 系统 的 API 
接口 ， 用 于 接收 并 处 理 任 务 调度 中 心 的 任务 请 求 。 路 由 函数 task_receive 首先 获取 请 求 参数 
taskId 和 name， 并 设置 字典 kwargs， 它 们 将 作为 异步 任务 AutoTask 的 函数 参数 。 
由 于 第 9 章 的 自动 化 程序 需要 配置 相应 参数 ， 并 且 这 些 参数 是 可 以 随机 变化 的 ， 本 书 
为 了 简化 系统 的 复杂 性 ， 直 接 在 路 由 函数 task_receive 定义 自动 化 程序 的 参数 。 在 实际 的 开 
发 过 程 中 ， 可 以 在 任务 调度 中 心 的 程序 信息 表 (数据 模型 ProgramInfo) 新 增 字 段 ， 用 于 设置 自 
动 化 程序 的 参数 ， 然 后 通过 HTTP 协议 传递 到 任务 执行 系统 ， 传 递 的 形式 与 参数 taskld 和 name 
一 致 即 可 。 

main.py 文件 作为 系统 的 运行 入 口 ， 因 此 在 过 _name “一 ”main ' 下 使 用 run 方法 设 
置 系统 的 运行 模式 。 在 启动 系统 之 前 ， 还 需要 开启 celery 框架 ， 在 PyCharm 的 Terminal 输 
入 celery -A taskInfo.celery worker -1 info -P solo 即 可 启动 celery。celery 的 启动 信息 如 图 
15-13 所 示 。 


[2018-10-04 13:43 


[2018-10-04 13:43 


[2018-10-04 13:43:25, 787: IN 
图 15-13 ”celery 启动 信息 


celery 启动 后 再 运行 main.py 文件 即 可 启动 系统 ， 在 浏览 器 上 输入 首页 的 路 由 地 址 并 设 
置 相应 的 请 求 参 数 ， 验 证 系统 功能 是 否 正常 运行 。 成 功 访问 首页 的 路 由 地 址 ， 浏 览 器 会 返 
回 JSON 的 数据 内 容 ， 然 后 在 PyCharm 的 Terminal 下 可 以 看 到 异步 任务 的 执行 请 求 ， 如 图 
15-14 所 示 。 

图 15-14 是 整合 了 浏览 器 的 页 面 以 及 PyCharm 的 Terminal 信息 内 容 。 在 浏览 器 上 的 路 
地 址 可 以 分 为 三 部 分 : IP 地 址 + 端口 、 请 求 参 数 name 和 请 求 参 数 taskId， 三 者 的 数据 可 
以 存放 在 任务 调度 中 心 的 数据 库 。 卫 地 址 + 端口 和 请 求 参数 name 对 应 程序 信息 表 〈 数 据 模 
型 ProgramInfo) 的 字段 clientIP 和 name; 请 求 参数 taskId 对 应 任务 记录 表 ( 数 据 模型 
TaskRecord) 的 主键 id。 
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15.5 ”系统 上 线 部 署 


现在 ， 我 们 已 经 开发 了 两 个 Web 应 用 系统 : 任务 调度 系统 和 任务 执行 系统 。 两 个 系统 


可 以 分 别 部 署 在 不 同 的 计算 机 上 ， 如 果 需 要 在 一 


个 局 域 网 或 互联 网 内 部 署 多 个 计算 机 ， 那 


么 任务 调度 系统 只 允许 部 署 在 一 台 计 算 机 上 ， 其 他 计算 机 则 为 任务 执行 系统 ， 这 样 可 实现 


一 台 计算 机 同时 操控 多 台 计算 机 执行 不 同 的 自 
出 于 读者 的 角度 考虑 ， 在 学 习 过 程 中 可 


的 Web 服务 器 有 Nginx、Apache 和 IIS， 


动 化 程序 。 


能 找 不 到 多 台 计 算 机 来 部 署 两 个 Web 应 用 系 
统 ， 因 此 我 们 将 两 个 Web 应 用 系统 同时 部 署 在 同一 台 计 算 机 上 ， 只 需 将 两 个 系统 的 端 
置 不 同 即 可 共存 在 同一 台 计 算 机 上 。 系 统 的 部 署 是 将 Web 应 用 系统 部 署 在 Web 服务 器 ， 

其 中 Nginx 和 Apache 支持 三 大 操作 系统 : 


设 
常 


Windows、MacOS 及 Linux， 而 IS 只 支持 Windows 系统 ， 它 是 Windows 系统 的 一 个 管理 


功能 


于 本 书 所 讲述 的 自动 化 程序 涉及 到 软件 


IIS 是 Intemet Information Services 的 缩写 ， 人 息 服 务 ， 是 由 


自动 化 开发 ， 它 必须 在 Windows 系统 下 才能 
正常 运行 ， 因 此 我 们 选择 IS 服务 器 来 部 署 两 个 Web 应 用 系统 。Web 服务 器 的 选择 并 不 是 
唯一 的 ， 也 可 以 在 Windows 下 使 用 Nginx 或 Apache 部 署 。 


基于 运行 Microsoft Windows 的 互联 网 基本 服务 。 它 是 一 种 Web (网 页 


括 Web 服务 器 、FTP 服务 器 、NNTP 服务 器 和 SMTP 服务 如 ， 分 别 上 


) 服务 组 件 ， 


于 网 


微软 公司 提供 的 


页 浏览 、 


目 中 包 
文件 传 


输 、 新 闻 服 务 和 邮件 发 送 等 方面 ， 它 使 得 在 网 络 〈 包 括 互联 网 和 局 域 网 ) 上 发 布 信息 成 了 


一 件 很 容易 的 事 。 


以 Windows 10 操作 系统 为 例 ， 默 认 情 况 ] 
的 ， 我 们 需要 在 “控制 面板 ”里 打开 “程序 
能 ”， 如 图 15-15 所 示 。 


和 功能 ”， 单 击 “ 启 上 


下 ，Windows 10 操作 系统 是 没有 安装 IIS 功能 
或 关闭 Windows 功 
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鲁 程序 和 功能 
名 v 个 国 > 控制 面板 > 所 有 控制 面板 项 > 程序 和 功能 
文件 (F) 编辑 ( 查看 (V) 工具 (D) 


i 仓 载 或 更 改 程序 


局 二 - 若 要 务 载 程 序 ， 请 从 列表 中 将 其 选中 
启用 或 关闭 Windows 功能 


图 15-15 启用 或 关闭 Windows 功能 


单 击 图 上 的 “启用 或 关闭 Windows 功能 ”就 会 进入 启用 或 关闭 Windows 功能 界面 ， 在 
该 界面 上 打开 “万 维 网 服务 ”， 将 “安全 性 ”、“ 常 见 HTTP 功能 ”、“ 性 能 功能 ”、 
“应 用 程序 开发 功能 ”以 及 “Internet Information Services 可 承载 的 Web 核 心 ” 的 所 有 选项 
全 部 勾 选 ， 然 后 单 击 “ 确 认 ” 按 钮 即 可 开启 IS 服务 ， 如 图 15-16 所 示 。 


局 windows 功能 


启用 或 关闭 Windows 功能 


若 要 启用 一 种 功能 ， 请 选择 其 复 选 框 。 若 要 关闭 一 种 功能 ， 请 清除 其 复 选 框 ， 填 
充 的 框 表示 仅 启用 该 功能 的 一 部 分 . 


五 国生 .NET Framework 3.5 (包括 NET20 和 30) 和 
五 加 看 NET Framework 4.7 高 级 服务 
回 重 Internet Explorer 11 
[© Internet Information services 
口 里 FTP 服务 器 
习 加 路 Web 管理 工具 


国 口 | 正 行 状况 和 2 页 
Internet Information Sevices 可 未 我 的 Web 核心 


图 15-16 开启 IIS 服务 


开启 IS 服务 需要 一 定 的 等 待 时 间 ，IIS 服务 开启 成 功 后 ， 在 Windows 的 “开始 菜单 ” 
里 找到 并 打开 “Windows 管理 工具 ” 即 可 找到 IIS， 如 图 15-17 所 示 。 

现在 已 成 功 开启 IS 服务 功能 ， 接 下 来 需要 安装 Python 的 wfastcgi 模块 。wfastcgi 表示 
使 用 WSGI 和 FastCGI， 在 IIS 和 Python 之 间 建 起 一 个 桥梁 ， 类 似 于 mod_python 为 Apache 
HTTP Server 提供 的 桥梁 。 它 可 以 与 任何 支持 WSGI 的 Python Web 应 用 程序 或 框架 一 起 使 
用 ， 并 提供 通过 IIS 处 理 请 求 和 进程 池 的 有 效 方法 。 简 单 地 说 ，wfastcgi 模块 就 是 将 我 们 开 
发 的 应 用 系统 与 IIS 进行 连接 。wfastcgi 模块 可 以 使 用 pip 指令 安装 ， 在 CMD 下 输入 pip 
install wfastcgi， 等 待 安装 即 可 。 
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| Windows 附件 
网 Windows 管理 工具 
本 Internet Information Services (IIS) 
思 iSCSI 发 起 程序 
是 ODBC 数据 源 (32 位 ) 
万 ODBC 数据 源 (64 位 ) 


医 Windows 内 存 诊断 

加 磁盘 清理 

巷 服务 

语 高 级 安全 Windows Defender 防火 墙 
< 恢复 驱动 器 


图 15-17 IIS 服务 器 
wfastcgi 模块 安装 成 功 后， 我 们 还 需要 开启 wfastcgi 服务 ， 使 用 管理 员 身 份 运行 CMD 
窗口 ， 将 路 径 地 址 切换 到 Python 安装 目录 的 Scripts 文件 夹 ， 然 后 输入 wfastcgi-enable 即 可 
开启 。 如 果 CMD 窗口 不 是 使 用 管理 员 身 份 运行 ， 并 且 执 行 wfastcgi 服务 开启 ， 系 统 会 提示 
权限 不 足 而 无 法 开启 ， 如 图 15-18 所 示 。 


图 15-18 权限 不 足 开启 wfastcgi 服务 


wfastcgi 服务 开启 后 ， 将 e:\python\python.exele:\python\lib\site-packages\wfastcgi.py 保存 
下 来 ， 这 段 配置 信息 需 配置 文件 里 ， 如 图 15-19 所 示 。 


WINDOW 


图 15-19 开启 wfastcgi 服务 
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wfastcgi 服务 只 要 开启 了 ， 不 管 计 算 机 是 关机 还 是 重启 ， 这 个 服务 都 会 自动 运行 ， 无 


须 重 复 开 启 ， 如 果 重 复 开 启 wfastcgi 服务 ， 第 二 次 开启 的 时 候 会 出 现 报错 信息 ， 如 图 15-20 
所 示 。 若 要 关闭 这 个 服务 ， 可 以 在 Python 安装 目录 的 Scripts 文件 夹 中 输入 wfastcgi-disable 
即 可 关闭 。 


图 15-20 重复 开启 wfastcgi 服务 


接着 在 任务 调度 系统 和 任务 执行 系统 的 系统 目录 下 添加 配置 文件 web.config。 由 于 两 


系统 的 运行 入 口 都 是 main.py 文件 ， 因 此 两 个 系统 的 配置 文件 web.config 的 内 容 是 相同 


的 ， 


如 下 所 示 : 


<?xml version="1.0" encoding="UTF-8"?> 

<configuration> 

<system.webServer> 

<security> 
<requestFiltering allowDoubleEscaping="true"> 
</requestFiltering> 

</security> 

<handlers> 
<add name="FastCgiModule" path="*" verb="*" 
modules="FastCgiModule" scriptProcessor= 
"e:\python\python.exele:\python\lib\site-packages\wfastcgi.py" 
resourceType="Unspecified" /> 

</handlers> 

</system.webServer> 

<appSettings> 
<!-- Required settings --> 
<add key="WSGI HANDLER" valu 
<add key="PYTHONPATH" value= 

</appSettings> 


main.app" /> 


</configuration> 
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配置 文件 的 scriptProcessor 就 是 wfastcgi 服务 开启 后 的 配置 信息 ; main.app 是 指 两 个 系 
统 的 运行 文件 main.py 里 面 的 app 对 象 ， 其余 的 配置 信息 都 是 固定 不 变 的 ， 无 须 更 改 。 


最 后 将 两 个 系统 分 别 部 署 到 IS 服务 器 上 ， 由 于 部 署 的 方式 一 样 ， 因 此 以 任务 执行 系 
统 为 例 ， 在 IS 的 “网 站 ” 右 击 ， 单 击 “添加 网 站 ”， 如 图 15-21 所 示 。 


v 与 ARTOR ZIOEES (LAPTO 入 远 : 


图 15-21 添加 网 站 


在 “添加 网 站 ”的 界面 上 分 别 设置 “网 站 名 称 ”“ 物 理 路 径 ” 和 “端口 ”。“ 网 站 名 
称 ” 可 根据 个 人 爱好 自行 设置 ; “物理 路 径 ” 是 指 系统 目录 所 在 的 路 径 地 址 ; “端口 ”是 
指 网 址 的 端 为 任务 执行 系统 的 调试 模式 端口 设置 8000， 因 此 ， 此 处 也 设 为 8000; 最 
后 单 击 < 确定 ， 按钮 即 可 ， 如 图 15-22 所 示 。 


PH 


关中: 人 地 址 (1): 


EH): 


示 风 www.contoso.com 或 marketing.contoso.com 


图 15-22 ”系统 部 署 
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由 于 任务 执行 系统 还 需要 开启 celery 框架 来 执行 异步 任务 ， 因 此 需要 通过 CMD 窗口 来 
运行 celery。 在 CMD 里 ， 将 路 径 切 换 到 任务 执行 系统 的 目录 ， 输 入 celery 的 启动 指令 即 可 


启动 celery， 如 图 15-23 所 示 。 


图 15-23 启动 celery 


按照 任务 执行 系统 的 部 署 方式 ， 将 任务 调度 中 心 也 部 署 到 IS 上 。“ 网 站 名 称 ” 设 置 
为 server; “物理 路 径 ” 指 向 系统 目录 所 在 的 路 径 地 址 ;， “端口 ”设置 为 8080。 

现在 已 完成 两 个 系统 的 部 署 ， 下 一 步 需 验 证 两 个 系统 之 间 能 否 正 常 运行 。 首 先 在 打开 
任务 调度 中 心 的 程序 信息 表 中 添加 一 条 程序 信息 : “JP 地 址 ”为 任务 执行 系统 的 他 地 址 ; 


二 . 计 


“描述 ”可 自 定义 内 容 ; “名 称 ” 为 trainTicket， 该 字段 是 请 求 参数 name 的 参数 值 ，“ 状 


态 锁 ” 设 置 为 空 值 ， 如 图 15-24 所 示 。 


局 到 到 | 
DD 各 目 动 化 管理 x ee 
€ GC © localhost808 9 时-) 
自动 化 管 程序 信息 表 
列表 (1) 创建 先 中 的 ~ 
本 IP 地 址 描述 名 称 状态 锁 
四 必 曾 http://localhost:8000/ Get train info trainTicket 


图 15-24 设置 程序 信息 
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世 
[ll 


“确定 ” 


选中 图 15-24 中 的 程序 信息 ， 单 击 “ 选 中 的 ”并 选择 “执行 任务 ”， 再 和 


按钮 即 可 向 任务 执行 系统 发 送 任务 请 求 ， 如 图 15-25 所 示 。 


CGC © localhost8080/admin/programinfo/ 


动 化 管理 系 经 localhost:8080 显示 
确定 执行 任务 ? 


列表 (1) | 创建 | 确定 | 取消 


可 IF 出 除 描述 名 称 


Get train info trainTicket 


图 15-25 ”发 送 任务 请 求 
任务 发 送 成 功 后 ， 我 们 可 以 看 到 状态 锁 的 值 显示 为 Lock， 当 再 次 刷新 网 页 的 时 候 ， 发 
现状 态 锁 的 值 为 空 ， 打 开 任 务 记录 表 可 以 看 到 任务 的 状态 为 “Done”， 如 图 15-26 所 示 ， 
这 说 明 任务 执行 系统 已 收 到 任务 请 求 ， 并 将 任务 结果 发 送 到 任务 调度 中 心 。 此 外 ， 我 们 也 
可 以 查看 celery 所 在 的 CMD 窗口 的 异步 任务 信息 。 


CQ@ localhost:8080/admin/taskrecord/ 


动 化 管理 系统 。 首页 。 程序 信息 表 “| 任务 记 录 表 


列表 (1) 创建 选中 的 ~ 


IP 地 址 名 称 Status 创建 时 间 


必 辣 http://localhost:8000/ trainTicket 2018-10-05 23:26:42 


图 15-26 任务 记录 表 


自动 化 系统 是 由 两 个 不 同 功能 的 Web 系统 组 成 的 ， 一 个 是 任务 调度 系统 ， 负 责 自动 化 
程序 的 信息 管理 和 控制 程序 的 运行 ， 另 一 个 是 任务 执行 系统 ， 主 要 接收 任务 请 求 并 执行 相 
应 的 自动 化 程序 ， 程 序 执行 完毕 再 将 运行 结果 发 送 到 任务 调度 系统 。 
整个 自动 化 系统 只 能 有 一 个 任务 调度 系统 ， 而 任务 执行 系统 可 以 是 一 个 或 多 个 ， 这 是 
系统 的 分 布 式 管理 的 原理 。 整 个 系统 的 完整 任务 调度 流程 说 明 如 下 : 
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(1) 当 任务 执行 系统 收 到 任务 调度 中 心 的 任务 请 求 后 ， 任 务 执行 系统 就 会 启动 并 运行 


本 地 的 自动 化 程序 。 


(2) 任务 调度 中 心 发 送 任务 请 求 后 会 生成 一 个 任务 锁 ， 该 锁 是 禁止 任务 调度 中 心 同时 


发 送 多 个 任务 请 求 。 


(3) 自动 化 程序 运行 完毕 后 ， 任 务 执行 系统 将 运行 结果 发 送 到 任务 调度 中 心 。 
(4) 任务 调度 中 心 收 到 运行 结果 后 ， 将 结果 记录 在 数据 库 并 释放 任务 锁 。 


任务 调度 系统 的 目录 结构 分 为 adtmin.py、main.py、modelspy 和 settings.py， 每 个 文件 
所 实现 的 功能 说 明 如 下 。 


admin.py: 实现 Admin 后 台 管 理 ， 由 flask-admin 模 块 实现 。 

main.py: 系统 的 运行 文件 ， 用 于 启动 任务 调度 中 心 的 运行 ; 定义 API 接 口 ， 用 于 接收 
任务 执行 系统 的 程序 运行 结果 。 

models.py: 定义 数据 模型 ， 实 现 Flask 与 MySQL 的 数据 映射 ， 由 flask-sqlalchemy 模 块 
settings.py: 网 站 的 配置 文件 ， 将 Flask 与 flask-babelex、flask-admin 和 flask-sqlalchemy 等 
模块 进行 绑 定 ， 使 第 三 方 模块 能 够 应 用 于 Flask 框 架 。 


任务 执行 系统 目录 结构 分 为 main.py、settings.py、taskInfo.py 和 trainTicketpy， 各 个 文 
件 所 实现 的 功能 说 明 如 下 。 


main.py: 系统 的 运行 文件 ， 用 于 启动 任务 执行 系统 的 运行 ; 定义 API 接 口 ， 用 于 接收 
任务 调度 中 心 的 任务 执行 请 求 。 

settings.py: 网 站 的 配置 文件 ， 将 Flask 与 celery 和 Redis 进 行 绑 定 ， 也 就 是 将 Flask 与 异步 
任务 框架 celery 绑 定 。 

taskInfo.py: 定义 异步 任务 框架 的 任务 ， 即 自动 化 程序 ， 由 celery 模 块 实现 。 
trainTicket.py: 文件 代码 来 自 第 9 章 的 实战 项 目 ， 实 现 12306 车 次 查询 功能 ， 它 主要 被 系 
统 的 异步 任务 调用 。 


